在中国和美国科技界,一个新兴的AI应用迅速崛起——DeepSeek。这个神秘的名字已经引发了广泛讨论,甚至有人将其称为大模型行业的最大“黑马”。在1月27日,DeepSeek的应用在苹果美国地区的App Store中爆红,一举登顶,超过了ChatGPT。同日,它还在中国区榜单中排名第一,瞬间成为热搜关键词,令人瞩目。
那么,DeepSeek到底是什么?全名为杭州深度求索人工智能基础技术研究有限公司,这家公司于2023年成立,专注于开发先进的大语言模型(LLM)和相关技术。去年12月,DeepSeek-V3发布后,一位业界领袖在社交平台上表示,这一模型是中国科技对美国科技的“苦涩教训”。在业内人士看来,当美国放松警惕时,中国的科技力量正以更低的成本和更高的效率迅速追赶。
DeepSeek的突破并非偶然。1月20日,他们正式开源了R1推理模型,标志着一个新的开始。DeepSeek声称,其最新模型在后训练阶段使用了大规模的强化学习技术,这使其在数学、代码及自然语言推理等多个任务上与OpenAI的正式版匹敌。英伟达的高级研究科学家对此表示了关注,认为这家非美公司的研究可能赋能全人类,展现出一种新时代的可能性。
DeepSeek之所以突然“爆火”,与其技术性能和极低的运营成本密不可分。业内专家指出,DeepSeek的R1模型在推理阶段大规模运用强化学习,凭借极少的标注数据,显著提升了模型的推理能力。而其预训练成本仅为557.6万美元,只有OpenAI GPT-4训练成本的十分之一,这让投资者看到了巨大的商业潜力。此外,DeepSeek的API定价也极具竞争力,每百万输入tokens的费用远低于OpenAI的收费,这让DeepSeek被戏称为AI界的“拼多多”。
至于DeepSeek的团队,虽然人数不到140人,但他们的背景同样引人注目。创始人梁文锋是顶尖量化私募幻方量化的创始人,他带领的团队几乎都是来自清华、北大等著名高校的年轻才俊,展现出中国科技领域的未来潜力。
总的来看,DeepSeek的崛起不仅是技术层面的突破,更是中国在全球科技竞赛中的一次重要展示。我们期待它能够带给全人类更多的惊喜和启示,推动人工智能的发展和应用。返回搜狐,查看更多
0 条