【
儀表網 儀表下游】隨著人工智能技術的發展,我們生活中的許多應用都帶上了“AI”的色彩,比如可以用計算機幫翻譯外文文檔。但有時候人工智也能會出一些小故障,變得不那么智能,尤其在語言處理方面。那么我們怎樣才能讓人工智能變成真正的“智能”呢?自然語言處理技術就是一個重要的方式。
自然語言處理技術是人工智能的一個重要分支,其目的是利用計算機對自然語言進行智能化處理。基礎的自然語言處理技術主要圍繞語言的不同層級展開,包括音位(語言的發音模式)、形態(字、字母如何構成單詞、單詞的形態變化)、詞匯(單詞之間的關系)、句法(單詞如何形成句子)、語義(語言表述對應的意思)、語用(不同語境中的語義解釋)、篇章(句子如何組合成段落)7個層級。這些基本的自然語言處理技術經常被運用到下游的多種自然語言處理任務中,如機器翻譯、對話、問答、文檔摘要等。
科學家研究自然語言處理技術的目的是讓機器能夠理解人類語言,用自然語言的方式與人類交流,最終擁有“智能”。AI時代,我們希望計算機擁有視覺、聽覺、語言和行動的能力,其中語言是人類區別于動物的最重要特征之一,語言是人類思維的載體,也是知識凝練和傳承的載體。在人工智能領域,研究自然語言處理技術的目的就是讓機器理解并生成人類的語言,從而和人類平等流暢地溝通交流。
人工智能學習語言存在的問題
目前存在的問題主要有兩個方面:一方面,迄今為止的語法都限于分析一個孤立的句子,上下文關系和談話環境對本句的約束和影響還缺乏系統的研究,因此分析歧義、詞語省略、代詞所指、同一句話在不同場合或由不同的人說出來所具有的不同含義等問題,尚無明確規律可循,需要加強語用學的研究才能逐步解決。
另一方面,人理解一個句子不是單憑語法,還運用了大量的有關知識,包括生活知識和專門知識,這些知識無法全部貯存在計算機里。因此一個書面理解系統只能建立在有限的詞匯、句型和特定的主題范圍內;計算機的貯存量和運轉速度大大提高之后,才有可能適當擴大范圍。
NLP是為各類企業及開發者提供的用于文本分析及挖掘的核心工具,已經廣泛應用在電商、金融、物流、文化娛樂等行業客戶的多項業務中。它可幫助用戶搭建內容搜索、內容推薦、輿情識別及分析、文本結構化、對話機器人等智能產品,也能夠通過合作,定制個性化的解決方案。由于理解自然語言,需要關于外在世界的廣泛知識以及運用操作這些知識的能力,所以NLP也被視為解決強人工智能的核心問題之一,其未來一般也因此密切結合人工智能發展,尤其是設計一個模仿人腦的神經網絡。
目前我們已經進入了以互聯網為主要標志的海量信息時代,這些海量信息大部分是以自然語言表示的。一方面,海量信息也為計算機學習人類語言提供了更多的“素材”,另一方面,這也為NLP提供了更加寬廣的應用舞臺。例如,作為NLP的重要應用,搜索引擎逐漸成為人們獲取信息的重要工具,出現了搜索引擎巨頭;機器翻譯也從實驗室走入尋常百姓家;基于NLP的中文輸入法(如搜狗、微軟等輸入法)成為計算機用戶的工具;帶有語音識別的計算機和手機也正大行其道,協助用戶更有效地工作和學習。
總而言之,自然語言技術的發展說明人工智能技術的核心還是在“人”。人工智能和機器學習帶給決策過程的支撐和信心將使創新加速,但這并不意味著人類的缺席。人們仍然需要定義分析的起點、標注主題并從收集的信息中提取所需數據。
資料來源:千家網、科普中國-科學原理一點通
所有評論僅代表網友意見,與本站立場無關。