學(xué)而思還沒有上線的數(shù)學(xué)大模型MathGPT和作文AI助手近日陷入了爭議。
6月13日、14日,學(xué)而思的作文素材產(chǎn)品合作方筆神作文兩次發(fā)文,指學(xué)而思在短短一個周末的時間,用爬蟲爬取其作文素材庫達(dá)200多萬次,盜取了公司的作文庫存。
學(xué)而思爬取合作商作文素材?
6月13日,筆神作文在公眾號和微博發(fā)文稱,學(xué)而思在今年4月13日至4月17日,通過“爬蟲”技術(shù)非法訪問、緩存筆神作文APP服務(wù)器數(shù)據(jù)多達(dá)258萬次。
筆神作文認(rèn)為,這一行為不僅違反了雙方的合同條款,也違反了《數(shù)據(jù)保護法》相關(guān)條款,嚴(yán)重侵犯了筆神作文APP的數(shù)據(jù)權(quán)益。
資料顯示,“筆神”和“筆神作文”是隸屬于北京一筆兩劃科技有限公司的品牌。該公司主要利用人工智能技術(shù),幫助寫作者提升寫作能力。
工商信息顯示,A股上市公司世紀(jì)天鴻(300654)是北京一筆兩劃公司第二大股東,持股比例18.47%。此外,搜狗旗下北京搜狗信息也持有公司15.5%股份,系第三大股東。此前,該公司還曾獲得真格基金投資。
筆神作文在官網(wǎng)發(fā)布的產(chǎn)品介紹顯示,其擁有千萬級寫作素材庫。在寫作過程中,可以基于用戶所寫內(nèi)容實時推送素材,幫助持續(xù)高效地寫作。
筆神作文與學(xué)而思之間有著多年的合作關(guān)系,這也成為雙方此次糾紛的導(dǎo)火索。
筆神作文表示,“在合作剛開始時我們抱著促進教育發(fā)展的心態(tài),為這位‘戰(zhàn)友’提供作文素材查詢服務(wù)。我們甚至還考慮到雙減政策下教育行業(yè)生存不易,將合同中約定好的服務(wù)費調(diào)整為三分之一?!?/p>
“然而學(xué)而思卻利用了我們的這份信任,利用了我們對合作伙伴的接口不設(shè)防。從4月13日開始在后臺頻繁、高密度地爬取我們的數(shù)據(jù)。直接登堂入室,盜取了我們的作文庫存?!惫P神作文稱。
筆神作文還表示,4月公司的作文庫數(shù)據(jù)被“竊取”,5月學(xué)而思的作文AI助手新產(chǎn)品就即將上線,未免過于“巧合”。疑似指學(xué)而思作文AI產(chǎn)品使用了其技術(shù)或素材。
對于筆神作文這一聲明,證券時報·e公司記者通過公開電話多次聯(lián)系公司,截至發(fā)稿未獲回復(fù)。
雙方各執(zhí)一詞
筆神作文在聲明中提到,希望學(xué)而思就此支付1元賠償金,并公開道歉,同時刪除已爬取的數(shù)據(jù)。
不過,6月13日晚,學(xué)而思就此回應(yīng)稱,公司對筆神作文接口的調(diào)用,屬于合同約定的正常合作范圍,對筆神素材內(nèi)容的使用均符合合同要求,并未用于合同以外的任何用途。
聲明提到,學(xué)而思和筆神作文于2020年12月開始合作,合作協(xié)議明確約定:筆神作文為學(xué)而思提供“筆神作文范文素材服務(wù)接口”,用于學(xué)而思相關(guān)服務(wù)中,每月保底費用包含的調(diào)用次數(shù)為百萬次量級。合作至今,雙方一直按照調(diào)用量進行正常結(jié)算。
對于筆神作文暗指學(xué)而思AI產(chǎn)品使用了其數(shù)據(jù),學(xué)而思表示,筆神作文主觀揣測公司使用其數(shù)據(jù)用于兩款產(chǎn)品的訓(xùn)練和研發(fā),這與事實嚴(yán)重不符。
“首先,MathGPT是專注于數(shù)學(xué)領(lǐng)域的自研大模型,沒有任何作文相關(guān)數(shù)據(jù);其次,作文AI助手目前處于開發(fā)狀態(tài),尚未發(fā)布,該服務(wù)并未使用筆神作文的任何數(shù)據(jù)?!?/p>
不過,6月14日晚,筆神作文再次發(fā)文稱,“學(xué)而思”在聲明里提到調(diào)用數(shù)據(jù)為正常使用,但在2023年4月13日至4月17日之間,公司檢測到服務(wù)器接口出現(xiàn)大量有規(guī)律的異常訪問,導(dǎo)致服務(wù)器承載壓力快速升高。
通過查閱服務(wù)器日志發(fā)現(xiàn):三體云聯(lián)公司(學(xué)而思關(guān)聯(lián)公司)未經(jīng)一筆兩劃公司授權(quán)許可,用單一IP通過“爬蟲”技術(shù)非法訪問一筆兩劃公司服務(wù)器數(shù)據(jù)多達(dá) 258 萬次。
筆神作文稱,學(xué)而思“爬蟲”基本上把庫里同個題目的所有作文全部抓取完了,這種行為不是正常人使用的方式。而且很多訪問的間隔都是100毫秒左右,也不可能是正常人訪問的速度。按業(yè)內(nèi)的通常說法,這就是一種典型的“扒庫”行為。
目前,學(xué)而思尚未對此作出回應(yīng)。
學(xué)而思年內(nèi)上線數(shù)學(xué)大模型
學(xué)而思是美股上市公司好未來旗下品牌。今年,AI大模型,好未來也在AI產(chǎn)品上,投入了大量精力。公司研發(fā)的產(chǎn)品就包括此次陷入爭議的MathGPT和作文AI助手。
5月5日,好未來官方公眾號發(fā)文表示,學(xué)而思正在進行數(shù)學(xué)大模型MathGPT的自研,該模型面向全球數(shù)學(xué)愛好者和科研機構(gòu),以數(shù)學(xué)領(lǐng)域的解題和講題算法為核心,目前已經(jīng)取得階段性成果,并將于年內(nèi)推出基于該大模型的產(chǎn)品級應(yīng)用。
學(xué)而思以數(shù)學(xué)培訓(xùn)起家。好未來表示,MathGPT是公司核心項目,由公司CTO(首席技術(shù)官)田密負(fù)責(zé)。
今年春節(jié)前,項目已啟動相應(yīng)的團隊建設(shè)、數(shù)據(jù)、算力準(zhǔn)備和技術(shù)研發(fā),并且已啟動在美國硅谷的團隊建設(shè),將成立一支海外算法和工程團隊。
在該文章中,好未來還提到,學(xué)而思學(xué)習(xí)機近期也將會上線一款“AI助手”,涵蓋作文助手、口語助手、閱讀助手、數(shù)學(xué)助手等相關(guān)功能,該AI產(chǎn)品將于5月11日開啟內(nèi)測。
AI之外,去年以來好未來還探索了多個新的業(yè)務(wù)方向。今年以來,好未來相繼發(fā)布了“學(xué)而思學(xué)習(xí)機”、“學(xué)而思大閱讀”等產(chǎn)品。
在直播方面,學(xué)而思旗下直播平臺“學(xué)家優(yōu)品”上線一年來,雖然歷經(jīng)多次調(diào)整,但一直不溫不火,截至目前其粉絲僅有21萬。
近期,該直播間宣布停播并進行調(diào)整。按照學(xué)家優(yōu)品主播的說法,10天后“學(xué)家優(yōu)品2.0”將上線。
校對:廖勝超