• 設(shè)為首頁
首頁華文教育

漢語智能寫作獲重大突破 自動(dòng)生成有感情的文稿

2016年06月02日 10:03 來源:人民日?qǐng)?bào) 參與互動(dòng)
字號(hào):

  輸入“時(shí)間”“學(xué)?!薄皡⒓尤藛T”和“領(lǐng)導(dǎo)”等大學(xué)生運(yùn)動(dòng)會(huì)關(guān)鍵詞,機(jī)器就迅速生成一篇1000多字的開幕式致辭,其中有致謝、天氣情況、運(yùn)動(dòng)會(huì)人數(shù)及項(xiàng)目等。更難能可貴的是,致辭還富有情感色彩——這是日前在“2016中國漢語智能寫作成果發(fā)布會(huì)”上的一幕。

  5月下旬,北京語言智能協(xié)同研究院發(fā)布漢語智能寫作重大突破——體育賽事新聞、大學(xué)生運(yùn)動(dòng)會(huì)開幕式致辭和高校學(xué)術(shù)活動(dòng)總結(jié)稿件可以由智能寫作平臺(tái)自動(dòng)完成寫作。該成果是首都師范大學(xué)副校長周建設(shè)教授擔(dān)任領(lǐng)銜專家的研究團(tuán)隊(duì)經(jīng)過多年探索,在語言智能研究領(lǐng)域取得的一項(xiàng)重大理論和技術(shù)突破。

  如何看待能夠自動(dòng)寫作的機(jī)器

  智能寫作平臺(tái)準(zhǔn)確、快捷地生成應(yīng)用稿件,具有開創(chuàng)性意義。北京大學(xué)計(jì)算語言學(xué)研究所所長王厚峰教授說,“演示令我很驚訝”。

  據(jù)周建設(shè)介紹,智能寫作是利用計(jì)算機(jī)完全自動(dòng)地對(duì)收集的文檔進(jìn)行整理、提取、過濾、篩選、組裝、寫作,自動(dòng)地生成相關(guān)文章。

  北京語言智能協(xié)同研究院特聘教授呂學(xué)強(qiáng)說,研究團(tuán)隊(duì)通過對(duì)受限語體海量篇章文本數(shù)據(jù)的挖掘,提出了一種大數(shù)據(jù)的漢語表達(dá)智能模型并研發(fā)了漢語受限語體智能寫作系統(tǒng),構(gòu)建了相關(guān)知識(shí)庫體系。目前,智能寫作平臺(tái)能夠完成受限語體的文稿,受限語體是有特定使用場(chǎng)合,結(jié)構(gòu)、格式比較固定的語體。

  這項(xiàng)漢語智能寫作重大突破,是國家社科基金重大招標(biāo)項(xiàng)目子項(xiàng)目——“自然語言信息處理的邏輯語義學(xué)研究·言語生成系統(tǒng)”“語言、思維、文化層次的高階認(rèn)知研究·語圖生成系統(tǒng)”的階段性成果;也是國家自然科學(xué)基金項(xiàng)目——“語義web中不確定知識(shí)的本體表示和融合的理論方法研究”“無監(jiān)督分詞及詞性歸納聯(lián)合方法研究”“e—earning中基于學(xué)業(yè)表情的情緒認(rèn)知分析研究”的階段性成果。

  據(jù)介紹,漢語智能寫作平臺(tái)包含32項(xiàng)關(guān)鍵技術(shù),其所寫文稿內(nèi)容流暢性、語義準(zhǔn)確性與人工寫作的差別在縮小。

  智能寫作平臺(tái)的理論技術(shù)創(chuàng)新

  想要機(jī)器像人一樣自如寫作,就要構(gòu)建“人一樣”的漢語表達(dá)智能模型。在語言生成的過程中,漢語智能寫作平臺(tái)對(duì)所要表達(dá)的信息進(jìn)行語義和語法方面的聚合,其中,內(nèi)容規(guī)劃即內(nèi)容確定+結(jié)構(gòu)構(gòu)造,句子規(guī)劃包括選詞、優(yōu)化聚合、指代表達(dá)式生成等,句子實(shí)現(xiàn)就是將經(jīng)句子規(guī)劃后的文本描述映射至由文字、標(biāo)點(diǎn)符號(hào)和結(jié)構(gòu)注解信息組成的表層文本。

  首都師范大學(xué)文學(xué)院教授史金生說,漢語智能寫作平臺(tái)構(gòu)建了基于漢語智能表達(dá)的知識(shí)庫,其一是語言模板庫——單詞、短語、句子語料庫;其二是語義類型庫——給漢語智能表達(dá)提供話語論域,以便將話題限定在特定語義領(lǐng)域內(nèi)布局謀篇、組織語句。有兩個(gè)子系統(tǒng)支持漢語表達(dá)智能模型,即“詞項(xiàng)—語句”語義網(wǎng)絡(luò),實(shí)現(xiàn)從詞到句子的自動(dòng)生成;“語句—語篇”語義網(wǎng)絡(luò),實(shí)現(xiàn)自然語言語篇的自動(dòng)生成。

  漢語智能寫作平臺(tái)的理論突破主要是多源成像基礎(chǔ)理論體系,即面向復(fù)雜教育知識(shí)體系,構(gòu)建音頻、視頻、文字、圖像為載體的多源異構(gòu)數(shù)據(jù)融合模型和多模態(tài)人機(jī)交互模型,探索客體成像、認(rèn)知成像和言語成像規(guī)律,解決客體、人腦與語言三個(gè)世界的成像同構(gòu)問題。

  漢語智能寫作平臺(tái)的技術(shù)突破主要體現(xiàn)在多模態(tài)認(rèn)知意象可視化技術(shù),包括智能教育機(jī)器人技術(shù)、學(xué)習(xí)軌跡跟蹤與處理技術(shù)、“語—圖”及“圖—語”轉(zhuǎn)換生成技術(shù)、語言生成與理解中的多源成像融合技術(shù)。

  中國科學(xué)技術(shù)信息研究所研究員張寅生說,從高混亂度的信息材料中抽取知識(shí),按特定場(chǎng)景、話題、文體進(jìn)行寫作,難度很大。他認(rèn)為,這種漢語集成寫作體現(xiàn)了人類智慧,是言語生成研究方向的歷史性突破。

  漢語智能寫作的孕育和應(yīng)用前景

  漢語智能寫作從最初設(shè)想到最終實(shí)現(xiàn),經(jīng)過了漫長跋涉。周建設(shè)早在上世紀(jì)80年代即開始語言智能理解表達(dá)相關(guān)問題研究,發(fā)表了多篇論文。其中《面向語言處理的計(jì)算與認(rèn)知取向》一文,提出了“語言智能表達(dá)目標(biāo)”,并初步提出構(gòu)建語言生成系統(tǒng)的設(shè)想;《基于大數(shù)據(jù)的漢語表達(dá)智能模型及其理論基礎(chǔ)》一文,提出了構(gòu)建基于大數(shù)據(jù)的漢語表達(dá)智能模型。

  2015年,在前期理論指導(dǎo)下,研究團(tuán)隊(duì)開發(fā)了漢語受限預(yù)提智能寫作平臺(tái),初步實(shí)現(xiàn)了前期構(gòu)想的漢語智能表達(dá)系統(tǒng)。

  北京語言智能協(xié)同研究院依托首都師范大學(xué),該校在語言智能研究領(lǐng)域擁有北京市成像技術(shù)高精尖中心、自然科學(xué)與社會(huì)科學(xué)兩界協(xié)同創(chuàng)新基地、市級(jí)協(xié)同創(chuàng)新中心等6個(gè)創(chuàng)新機(jī)構(gòu),還擁有3個(gè)相關(guān)博士學(xué)位授予權(quán)的一級(jí)學(xué)科、多個(gè)國家重點(diǎn)學(xué)科和北京高校重點(diǎn)實(shí)驗(yàn)室。研究院現(xiàn)有包括哈佛大學(xué)在內(nèi)的協(xié)同單位20余家,研究團(tuán)隊(duì)專家100余人。近3年來,研究院參與科研項(xiàng)目30余項(xiàng),獲得發(fā)明專利15項(xiàng),軟件著作權(quán)40項(xiàng),各類大數(shù)據(jù)資源庫、語料庫20余種。研究團(tuán)隊(duì)2016年在研項(xiàng)目包括國家社科基金重大委托項(xiàng)目、國家語委重大課題等,未來研究方向?yàn)榻鹑诤腕w育新聞、應(yīng)用文書自動(dòng)寫作,中小學(xué)生作文輔助寫作,還將瞄準(zhǔn)智能教育機(jī)器人產(chǎn)品。

  來自北京航空航天大學(xué)計(jì)算機(jī)學(xué)院的張小明認(rèn)為,漢語智能寫作平臺(tái)生成的文稿內(nèi)容流暢,還加入了情感因素,有很大應(yīng)用價(jià)值。(董洪亮)

【編輯:梁異】
中國僑網(wǎng)微信公眾號(hào)入口

>華文教育頻道精選:

網(wǎng)站介紹 | 聯(lián)系我們 | 廣告服務(wù) | 供稿信箱 | 版權(quán)聲明 | 招聘啟事

中國僑網(wǎng)版權(quán)所有,未經(jīng)授權(quán)禁止復(fù)制和建立鏡像 [京ICP備05004340號(hào)-12 ] [京公網(wǎng)安備:110102001262]
違法和不良信息舉報(bào)電話:(010)68315039 舉報(bào)郵箱:huaren@chinanews.com.cn

Copyright©2003-2025 chinaqw.com. All Rights Reserved

關(guān)注僑網(wǎng)微信
亚洲欧美日韩国产另类一区,看片 国产 一区,无码专区中文字幕视频在线,国产成人无卡在线观看