隨著人工智慧技術的發展,我們生活中的許多應用都帶上了“AI”的色彩,比如可以用計算機幫翻譯外文文件。但有時候人工智也能會出一些小故障,變得不那麼智慧,尤其在語言處理方面。那麼我們怎樣才能讓人工智慧變成真正的“智慧”呢?自然語言處理技術就是一個重要的方式。
自然語言處理技術(即natural language processing,簡稱NPL)是人工智慧的一個重要分支,其目的是利用計算機對自然語言進行智慧化處理。基礎的自然語言處理技術主要圍繞語言的不同層級展開,包括音位(語言的發音模式)、形態(字、字母如何構成單詞、單詞的形態變化)、詞彙(單詞之間的關係)、句法(單詞如何形成句子)、語義(語言表述對應的意思)、語用(不同語境中的語義解釋)、篇章(句子如何組合成段落)7個層級。這些基本的自然語言處理技術經常被運用到下游的多種自然語言處理任務中,如機器翻譯、對話、問答、文件摘要等。
科學家研究自然語言處理技術(NLP)的目的是讓機器能夠理解人類語言,用自然語言的方式與人類交流,最終擁有“智慧”。AI時代,我們希望計算機擁有視覺、聽覺、語言和行動的能力,其中語言是人類區別於動物的最重要特徵之一,語言是人類思維的載體,也是知識凝練和傳承的載體。在人工智慧領域,研究自然語言處理技術的目的就是讓機器理解並生成人類的語言,從而和人類平等流暢地溝通交流。
但現在的人工智慧常常和我們的人工評價有很大的出入,這也是基於AI演算法的自動評測面臨的最大挑戰:如何與人工評價保持一致?應對這個挑戰需要解決很多問題。以智慧閱卷為例:如何制定電腦適用的評測標準?人工智慧如何應對語言的千變萬化?如何設計閱卷綜合性的評測指標?有科學家認為,大資料與富知識雙輪驅動或許能成為解決問題的關鍵,即在大資料驅動的基礎上加入富知識驅動,可以突破現在智慧語言處理技術上的瓶頸。
總而言之,自然語言技術的發展說明人工智慧技術的核心還是在“人”。“人工智慧和機器學習帶給決策過程的支撐和信心將使創新加速,但這並不意味著人類的缺席。人們仍然需要定義分析的起點、標註主題並從收集的資訊中提取所需資料。”
本文由北京市第六十五中學一級教師李巖進行科學性把關。
新華網科普事業部
科普中國-科學原理一點通
聯合出品
更多精彩內容,請下載科普中國客戶端。