11/03/2025 08:37
【AI】阿里研究院:DS通過更巧妙工程設計,挖掘大模型潛力
《經濟通通訊社11日專訊》阿里研究院發表文章指出,人工智能(AI)初創企業DeepSeek以相對較小成本實現高性能大模型的發展創新,不僅證明了人工智能技術發展路徑的多元性和動態性,更重要的是推動開源大模型發展實現了新的躍遷。 文章指,在DeepSeek之前,圍繞人工智能是否應開源的爭議日趨激烈,在此背景下,DeepSeek是對開源大模型價值的強有力支持:正是站在LLaMa、千問等開源大模型的基礎上,DeepSeek通過更巧妙的工程設計挖掘了大模型的內在潛力、實現了性能上的超越。 另一方面,如果開源需要真正成為大模型的主導性發展模式,不可回避的另一重要問題仍然是開源大模型風險治理的改革,即能否創新開源治理機制,以回應大模型開源後所可能引發的風險擔憂。(ct)
etnet榮膺「第九屆傳媒轉型大獎」四大獎項► 查看詳情