国产av人人妻人人爽,疯狂做受xxxx高潮视频免费 ,粉嫩被粗大进进出出视频,丁香色欲久久久久久综合网,chinese性内射高清国产

論道數(shù)智先鋒丨中科聞歌王磊:讓人工智能在賦能千行百業(yè)的過(guò)程中綻放價(jià)值(3圖)

發(fā)布時(shí)間:2025-02-07 16:44 | 來(lái)源:新華網(wǎng) 2025 01/26 17:31:11 | 查看:4345次

2017年,懷著“讓實(shí)驗(yàn)室里的技術(shù)走向市場(chǎng)”、“把科研成果寫在祖國(guó)的大地上”的初心,5位來(lái)自中科院自動(dòng)化所的科研人員,聯(lián)合創(chuàng)立了一家人工智能公司——中科聞歌,投身于人工智能前沿技術(shù)的研發(fā)和產(chǎn)業(yè)化實(shí)踐。

七年磨一劍,中科聞歌憑借扎實(shí)的技術(shù)功底和不懈的場(chǎng)景創(chuàng)新站穩(wěn)了腳跟,產(chǎn)品與技術(shù)廣泛應(yīng)用于媒體、金融、治理等領(lǐng)域。日前,中科聞歌宣布完成新一輪戰(zhàn)略融資,由北京市人工智能產(chǎn)業(yè)投資基金投資,迄今為止已累計(jì)完成超十億元融資。

本期《論道數(shù)智先鋒》欄目,新華網(wǎng)對(duì)話中科院自動(dòng)化所研究員、中科聞歌董事長(zhǎng)王磊。這位前沿技術(shù)的探索者、商業(yè)落地的先行者表示,要在賦能千行百業(yè)的過(guò)程中磨練實(shí)力,才能在人工智能的技術(shù)浪潮中彎道超車。

人工智能發(fā)展一日千里

中科聞歌的“聞歌”二字,和“高山流水”出自同一典故,都源于《呂氏春秋》中伯牙子期的故事。子期能夠根據(jù)伯牙的琴聲,判斷出他志在高山還是流水。所以后人用“聞弦歌而知雅意”比喻擅于推理,形容一個(gè)人很聰明,能聽(tīng)懂弦外之音。

王磊介紹:“中科聞歌瞄準(zhǔn)的是人工智能下一代的新技術(shù)——認(rèn)知和決策智能,認(rèn)知和決策智能的核心,就是推理和規(guī)劃能力?!?/p>

感知智能、認(rèn)知智能、決策智能,是業(yè)界從技術(shù)角度給人工智能劃分的三個(gè)層次或發(fā)展階段。感知智能就是讓人工智能學(xué)會(huì)“聽(tīng)”或“看”,即運(yùn)用語(yǔ)音識(shí)別、圖像處理、視頻分析等技術(shù)處理信息;認(rèn)知智能是讓人工智能“聽(tīng)得懂”或“看得懂”,這包括對(duì)信息的整合、理解和解釋;決策智能則是讓人工智能在復(fù)雜的環(huán)境中知道該“怎么做”。

“人工智能無(wú)疑是當(dāng)前最具革命性、顛覆性的技術(shù)之一,尤其是ChatGPT掀起新一輪技術(shù)革命以來(lái),我們感受到了一日千里的發(fā)展速度。”王磊表示,“我們希望公司能引領(lǐng)人工智能的技術(shù)發(fā)展,從感知智能、認(rèn)知智能向決策智能跨越,實(shí)現(xiàn)人工智能面向復(fù)雜場(chǎng)景的商業(yè)化落地?!?/p>

之所以立下這樣的目標(biāo),因?yàn)橹锌坡劯璧暮诵膱F(tuán)隊(duì)均來(lái)自中國(guó)科學(xué)院等知名科研院所及海內(nèi)外頂尖高校。早在公司成立之前,團(tuán)隊(duì)在人工智能領(lǐng)域就有了十余年的理論研究、技術(shù)研發(fā)及應(yīng)用實(shí)踐積累,并一直致力于學(xué)術(shù)研究向產(chǎn)業(yè)賦能的探索。

“在人工智能這個(gè)賽道,我們既做硬核的底層技術(shù),又做實(shí)際的行業(yè)應(yīng)用?!睋?jù)王磊介紹,中科聞歌以DIOS決策智能操作系統(tǒng)為技術(shù)底座,面向各行業(yè)數(shù)智化轉(zhuǎn)型需求進(jìn)行研發(fā),通過(guò)自主可控的雅意(YaYi)多語(yǔ)言大模型、優(yōu)雅(YoYa)多模態(tài)視頻大模型、智川通用決策智能平臺(tái),將傳統(tǒng)依賴常識(shí)及經(jīng)驗(yàn)的人工決策提升為數(shù)據(jù)智能驅(qū)動(dòng)的AI輔助決策,實(shí)現(xiàn)在具體場(chǎng)景的商業(yè)化落地,讓人工智能技術(shù)賦能千行百業(yè)萬(wàn)企。

DIOS決策智能操作系統(tǒng)

“底層技術(shù),是對(duì)技術(shù)積累的長(zhǎng)期堅(jiān)持;行業(yè)產(chǎn)品,是獲得市場(chǎng)收入和形成正向現(xiàn)金流的重要來(lái)源。這兩者形成飛輪、相互促進(jìn),在技術(shù)和市場(chǎng)兩個(gè)方向上同時(shí)進(jìn)步,才能支撐起一家公司的持續(xù)發(fā)展?!蓖趵诒硎?。

他希望,中科聞歌作為中科院走出來(lái)的人工智能企業(yè),一方面要在技術(shù)上領(lǐng)先,做到底層技術(shù)非常扎實(shí)、前沿研究持續(xù)推進(jìn),同時(shí)也要在商業(yè)變現(xiàn)和產(chǎn)業(yè)落地方面邁出有力的步伐,成為一家可以持續(xù)盈利、自我造血的人工智能企業(yè)。

大模型的“燃料”不夠用了

盡管人工智能發(fā)展一日千里,國(guó)內(nèi)外大模型百花齊放,但2024年以來(lái)似乎開(kāi)始遇冷。卷參數(shù)、卷性能、卷規(guī)模的“百模大戰(zhàn)”背后,需要巨量的數(shù)據(jù)支撐模型的學(xué)習(xí)、訓(xùn)練和優(yōu)化,作為“燃料”的數(shù)據(jù)不夠用了,大模型就開(kāi)始“卷不動(dòng)”了。

早在全球范圍的大模型浪潮出現(xiàn)之前,第三方研究機(jī)構(gòu)Epoch AI就曾發(fā)出預(yù)警,原始數(shù)據(jù)增長(zhǎng)的速度難以支撐人工智能行業(yè)發(fā)展的速度。Epoch AI今年6月發(fā)布的最新研究稱,在2026-2032年之間的某個(gè)時(shí)間點(diǎn),科技公司就會(huì)用光公開(kāi)可用的訓(xùn)練數(shù)據(jù)。

圖源:Epoch AI

“想要明白為什么會(huì)出現(xiàn)這種情況以及如何解決,首先我們要搞清楚數(shù)據(jù)、語(yǔ)料和高質(zhì)量語(yǔ)料的區(qū)別?!蓖趵诮忉尩馈?/p>

簡(jiǎn)單來(lái)說(shuō),數(shù)據(jù)是一切線上或線下行為留下的痕跡,不管是來(lái)自人類還是由計(jì)算機(jī)產(chǎn)生,包括文本、圖像、音頻、視頻等多種形式。而語(yǔ)料是一個(gè)計(jì)算機(jī)術(shù)語(yǔ),是用于訓(xùn)練算法、機(jī)器學(xué)習(xí)的“原材料”,是教會(huì)大模型理解和生成人類語(yǔ)言的“教材”。語(yǔ)料的質(zhì)量直接關(guān)系著大模型的性能,經(jīng)過(guò)篩選和處理的高質(zhì)量語(yǔ)料,才能夠達(dá)到舉一反三的學(xué)習(xí)效果。

在王磊看來(lái),高質(zhì)量數(shù)據(jù)和語(yǔ)料短缺的問(wèn)題確實(shí)存在,尤其是高質(zhì)量中文語(yǔ)料更是非常稀缺。

“我們關(guān)注到,國(guó)外的一些大模型公開(kāi)的數(shù)據(jù)訓(xùn)練集中,中文占比不到10%,甚至不到5%,而且其中有大量非主流價(jià)值觀的語(yǔ)料或數(shù)據(jù)集合?!蓖趵谡f(shuō)道,“這讓我們開(kāi)始意識(shí)到,中文語(yǔ)料是比較欠缺的。”

中文語(yǔ)料的稀缺,歸根結(jié)底在于全球互聯(lián)網(wǎng)中文信息的相對(duì)匱乏。阿里研究院2024年5月發(fā)布的《大模型訓(xùn)練數(shù)據(jù)白皮書》顯示,全球網(wǎng)站英文內(nèi)容占比高達(dá)59.8%,中文僅占1.3%,互聯(lián)網(wǎng)上中、英文語(yǔ)料占比存在顯著差異。

“還有很多中文語(yǔ)料在企業(yè)或政府內(nèi)部,以及圖書館、出版社這些專業(yè)機(jī)構(gòu)手里面,無(wú)法成為大模型學(xué)習(xí)和訓(xùn)練的語(yǔ)料。因?yàn)楹芏鄡?nèi)部材料并不在互聯(lián)網(wǎng)上公開(kāi),甚至有一些還沒(méi)有數(shù)據(jù)化、電子化,這就更凸顯出中文語(yǔ)料的不足?!蓖趵谡f(shuō)。

他還指出,即便是互聯(lián)網(wǎng)上現(xiàn)有的中文網(wǎng)頁(yè),要轉(zhuǎn)化成訓(xùn)練大模型能用的語(yǔ)料數(shù)據(jù),也需要經(jīng)過(guò)篩選、清洗、優(yōu)化等多道工序?!氨热?00TB的數(shù)據(jù),可能要去掉90%甚至95%,最后只留下5%高質(zhì)量和高價(jià)值的語(yǔ)料信息。”

所幸“語(yǔ)料荒”的問(wèn)題并非無(wú)解,國(guó)家數(shù)據(jù)局等相關(guān)部門已經(jīng)出臺(tái)或者正在規(guī)劃一系列政策,支持高質(zhì)量中文語(yǔ)料庫(kù)的建設(shè)。比如《“數(shù)據(jù)要素×”三年行動(dòng)計(jì)劃(2024-2026年)》明確提出:“建設(shè)高質(zhì)量語(yǔ)料庫(kù)和基礎(chǔ)科學(xué)數(shù)據(jù)集,支持開(kāi)展人工智能大模型開(kāi)發(fā)和訓(xùn)練?!?/p>

王磊呼吁:“高質(zhì)量中文語(yǔ)料庫(kù)建設(shè)是一個(gè)復(fù)合性工程,首先需要國(guó)家政策的相關(guān)支持,其次需要行業(yè)之間的市場(chǎng)化交流,最后也要鼓勵(lì)企業(yè)級(jí)數(shù)據(jù)庫(kù)開(kāi)源,合力打造一個(gè)共同構(gòu)建、共同運(yùn)營(yíng)、共同分享、共同交流的良性生態(tài)?!?/p>

國(guó)產(chǎn)大模型如何彎道超車

高質(zhì)量語(yǔ)料數(shù)據(jù)的短缺,讓業(yè)內(nèi)不再迷信靠“刷題”來(lái)推動(dòng)模型性能改善的技術(shù)路線。中國(guó)的大模型企業(yè)也不再執(zhí)著于做“中國(guó)版ChatGPT”,以中科聞歌為代表的企業(yè),已另外覓得彎道超車的機(jī)會(huì)。

雖然以O(shè)penAI為代表的一些國(guó)外科技企業(yè),占據(jù)了人工智能的先發(fā)陣地,但中國(guó)企業(yè)正在全力趕超。據(jù)中國(guó)信息通信研究院近日發(fā)布的《全球數(shù)字經(jīng)濟(jì)白皮書》,國(guó)產(chǎn)大模型數(shù)量占到全球的36%,僅次于美國(guó)的44%;人工智能企業(yè)數(shù)量上,中國(guó)也以15%的占比緊隨美國(guó)之后,位列第二。

在王磊看來(lái),無(wú)論哪個(gè)國(guó)家的企業(yè),都在結(jié)合各自優(yōu)勢(shì)探索不同發(fā)展路徑,為拓展人工智能的邊界作出貢獻(xiàn),這些研究成果是全人類共有的。

“我們要看到差距、正視差距,同時(shí)也要滿懷信心?!蓖趵谥赋觯S著國(guó)家牽頭,不斷加大對(duì)人工智能的投入力度,不僅核心技術(shù)上的差距將逐步縮小,中國(guó)也將憑借其他國(guó)家無(wú)法匹敵的市場(chǎng)前景,在人工智能賦能千行百業(yè)的過(guò)程中彰顯出強(qiáng)大實(shí)力。

今年3月,“人工智能+”首次被寫入政府工作報(bào)告,為發(fā)展數(shù)字經(jīng)濟(jì)、推進(jìn)數(shù)實(shí)融合指明了新路徑。從“人工智能”到“人工智能+”,意味著國(guó)家層面將加強(qiáng)頂層設(shè)計(jì),推動(dòng)人工智能技術(shù)與各行各業(yè)緊密融合,加快形成以人工智能為引擎的新質(zhì)生產(chǎn)力。

王磊也建議:“要把中國(guó)巨大的市場(chǎng)和生產(chǎn)力優(yōu)勢(shì)利用起來(lái),讓人工智能技術(shù)和各行各業(yè)深度融合,通過(guò)生產(chǎn)效率的大幅提升,促進(jìn)人工智能價(jià)值變現(xiàn);再通過(guò)技術(shù)的價(jià)值變現(xiàn),讓人工智能產(chǎn)業(yè)達(dá)到新的水平,進(jìn)一步推動(dòng)經(jīng)濟(jì)的高質(zhì)量發(fā)展?!?/p>

依托場(chǎng)景落地驅(qū)動(dòng)技術(shù)創(chuàng)新,也是中科聞歌一直以來(lái)的發(fā)展路線,其應(yīng)用場(chǎng)景從媒體逐步拓展至金融、政務(wù)、能源等各行各業(yè),因此積累了豐富的行業(yè)“know-how”。在此基礎(chǔ)上,中科聞歌在高質(zhì)量中文語(yǔ)料庫(kù)的建設(shè)上開(kāi)始了新的探索——和垂直領(lǐng)域的頭部公司、領(lǐng)軍機(jī)構(gòu)合作,共建高質(zhì)量行業(yè)語(yǔ)料集。

從熟悉的傳媒領(lǐng)域出發(fā),不久前新華網(wǎng)與中科聞歌聯(lián)合推出了“多模態(tài)出版語(yǔ)料生產(chǎn)與智慧服務(wù)系統(tǒng)”。打造集多模態(tài)語(yǔ)料加工、知識(shí)抽取、內(nèi)容編目與檢索的一站式語(yǔ)料生產(chǎn)服務(wù),助推媒體出版行業(yè)盤活多年積累的中文語(yǔ)料數(shù)據(jù),通過(guò)開(kāi)放共享、流通應(yīng)用發(fā)揮更大的價(jià)值。

王磊表示,新華網(wǎng)作為中國(guó)最具影響力的網(wǎng)絡(luò)媒體和具有全球影響力的中文網(wǎng)站,具備引領(lǐng)行業(yè)建設(shè)中文數(shù)據(jù)庫(kù)或語(yǔ)料庫(kù)的先天優(yōu)勢(shì)。中科聞歌則擁有自主研發(fā)的技術(shù)底座和大模型,又在長(zhǎng)期合作中鍛煉出將數(shù)據(jù)轉(zhuǎn)化成高質(zhì)量語(yǔ)料和對(duì)大模型進(jìn)行優(yōu)化訓(xùn)練的整套技術(shù)。二者聯(lián)手,自然是強(qiáng)強(qiáng)聯(lián)合。

“我們期待中科聞歌能夠在和新華網(wǎng)的合作中,發(fā)揮各自的技術(shù)優(yōu)勢(shì)和資源積累,把出版行業(yè)語(yǔ)料做成一個(gè)標(biāo)桿示范工程。然后把這種創(chuàng)新做法擴(kuò)展到其他領(lǐng)域,帶動(dòng)各行各業(yè)形成共享共用的生態(tài),為我們國(guó)家人工智能大模型的訓(xùn)練,提供充足的高質(zhì)量語(yǔ)料支持、服務(wù)。”


用戶名:驗(yàn)證碼:點(diǎn)擊我更換圖片                *如果看不清驗(yàn)證碼,請(qǐng)點(diǎn)擊驗(yàn)證碼更新。