前天做了个视频跟大家介绍了DeepSeek R1推理模型是怎么训练出来的,今天想用通俗语言跟大家说下R1的基石DeepSeek V3。首先我们知道V3是非推理模型,它和海外顶尖厂商的非推理模型弱GPT-4O mini等性能相当甚至更好。它是怎么做到的呢?