人工智能正在以前所未有的速度改變世界,當大模型的能力呈指數(shù)級躍遷,AI產業(yè)的競爭焦點,也正在悄然發(fā)生變化。如果說過去十年,AI產業(yè)的核心在算法與算力;那么未來十年,數(shù)據(jù)質量、反饋質量與評測體系,將成為決定AI上限的重要要素。一個新的產業(yè)形態(tài)正在誕生——AI數(shù)據(jù)生產與評測系統(tǒng)。正如半導體制造從IDM模式升級為純晶圓代工模式,AI數(shù)據(jù)行業(yè)也正在從傳統(tǒng)“數(shù)據(jù)標注”,走向更復雜、更工程化的數(shù)據(jù)生產與評測體系。
一、AI數(shù)據(jù)產業(yè)的必然升級:從富士康到臺積電
在電子工業(yè)時代,富士康代表的是規(guī);圃炷芰。而臺積電代表的,則是先進制造能力和芯片評測體系。
今天的AI數(shù)據(jù)產業(yè),正處在類似的歷史拐點。
傳統(tǒng)的數(shù)據(jù)標注公司,更像是AI時代的“富士康”——通過人力規(guī);瓿苫A的數(shù)據(jù)生產。
而未來真正的AI數(shù)據(jù)企業(yè),將更像是“臺積電”:它們不只是提供人力,而是構建更完整的數(shù)據(jù)生產、反饋和評測能力,包括但不限于:
· 面向監(jiān)督微調(SFT)的高質量訓練數(shù)據(jù)
· 面向強化學習與偏好優(yōu)化的數(shù)據(jù)生產(RLHF/Preference Data)
· 面向Agent能力提升的軌跡數(shù)據(jù)、環(huán)境數(shù)據(jù)與評測數(shù)據(jù)
· 面向復雜場景的專業(yè)領域數(shù)據(jù)與專家反饋
· 面向模型迭代的人機協(xié)同評測與質量控制體系等等
為了應對這一趨勢,曼孚科技研發(fā)了以下各大平臺,包括:
· AI數(shù)據(jù)生成&合成平臺(涵蓋各類RL環(huán)境等)
· General Agent平臺(支持復雜長程任務規(guī)劃與執(zhí)行)
· 自有Eval體系(支持快速驗證model/agent在非公開benchmark上的表現(xiàn))
依托上述平臺,曼孚實現(xiàn)了工業(yè)級、體系化、可規(guī)模復制的數(shù)據(jù)制造和評測能力,為大模型的迭代升級提供有力的支持。
二、Token:AI時代的“電力消耗”,曼孚千億日耗詮釋AI時代生產力
在AI時代,一個公司的技術實力,不再只看模型參數(shù),而要看Token消耗量。
Token,正在成為AI時代最真實的生產指標。就像電力消耗代表工業(yè)規(guī)模,算力消耗代表互聯(lián)網(wǎng)規(guī)模。Token消耗,則代表AI生產力。
目前,曼孚科技的日Token消耗量已達到千億級別。
這意味著:曼孚不僅是一家AI數(shù)據(jù)公司,更是一家真正深度融合AI的平臺型公司。
因為只有真正把AI深度融入生產流程的企業(yè),才會產生如此規(guī)模的Token消耗。
三、萬億美金的大模型公司VS千億美金的AI數(shù)據(jù)公司
今天,全球科技產業(yè)正處在新的臨界點。萬億美金級的大模型巨頭(OpenAI)已立于潮頭。 而在這些公司背后,一個同樣巨大的產業(yè)也正在崛起——AI數(shù)據(jù)產業(yè)。
如果說算力是AI的發(fā)動機,算法是AI的操作系統(tǒng),那么數(shù)據(jù),就是AI的燃料。
未來的AI競爭,本質上就是:誰擁有更領先的數(shù)據(jù)生產與評測能力。
因此,在萬億美金的大模型巨頭背后,千億美金級的AI數(shù)據(jù)公司,也必將應運而生。
正是在這樣的產業(yè)趨勢之下,曼孚科技正在積極構建面向大模型時代的AI數(shù)據(jù)基礎設施。
在未來的AI產業(yè)鏈中,大模型公司負責模型創(chuàng)新,算力公司提供計算基礎設施,而像曼孚科技這樣的企業(yè),將成為AI時代數(shù)據(jù)基礎設施的提供者。
未來十年,AI產業(yè)的競爭將不再只是模型參數(shù)的競爭,算力規(guī)模的競爭;更是AI數(shù)據(jù)生產與評測體系的競爭。誰能夠構建先進AI數(shù)據(jù)生產與評測體系,誰就能夠成為AI時代的關鍵基礎設施,正如臺積電之于半導體產業(yè)。而曼孚科技的目標,正是成為AI數(shù)據(jù)產業(yè)的臺積電。



