原本需要投入上亿美元才能训练好的大语言模型,被中国一家初创公司给硬生生地压至数百万美元就能训练出来。 这家来自杭州的初创公司深度求索(DeepSeek)12月26日在微信公众号上宣布全新的开源大模型DeepSeek V3,并大方公布53页的技术论文,披露该模型的 ...