Apache OpenNLP整合ONNX Runtime現可高效執行Transformer模型

微軟和Apache OpenNLP專案,在,於Java服務和應用程式提供經加速的自然語言處理(NLP)推理運算,也就是說,除了OpenNLP自己的模型格式之外,現在透過添加ONNX Runtime,來支援包括ONNX以及其他模型格式。

Apache OpenNLP是一個Java自然語言處理開源機器學習函式庫,被許多知名開源應用程式使用,包括Apache Solr、Apache UIMA和Apache Lucene等,同時也被應用在許多商業專案和學術研究中。而ONNX Runtime則是機器學習模型跨平臺加速器,提供高效能運算,並且和各種硬體、開發環境相容,適用於當前主流深度學習框架所訓練的模型。

Apache OpenNLP的發展要追溯到2000年代初期,其運用最大熵值和基於感知器(Perceptron)的演算法,進行語句偵測、標記化(Tokenization)、語言偵測和命名實體偵測等自然語言處理任務。

雖然最大熵值和感知器模型訓練方法不需要用到GPU,額外成本相對較低,但是訓練出來的模型,卻無法與使用Transformer架構的現代化自然語言處理模型效能相比,Apache OpenNLP團隊提到,儘管有許多自然語言處理開發已經轉移到Python生態系,但是Java開發人員也還是需要各種強大的自然語言處理功能,畢竟Java仍然是熱門的程式語言之一。

回頭車貨運收費標準,宇安交通關係企業,自成立迄今,即秉持著「以誠待人」、「以實處事」的企業信念

好山好水露營車漫遊體驗

露營車x公路旅行的十一個出遊特色。走到哪、玩到哪,彈性的出遊方案,行程跟出發地也可客製

網頁設計公司推薦不同的風格,搶佔消費者視覺第一線

透過選單樣式的調整、圖片的縮放比例、文字的放大及段落的排版對應來給使用者最佳的瀏覽體驗,所以不用擔心有手機版網站兩個後台的問題,而視覺效果也是透過我們前端設計師優秀的空間比例設計,不會因為畫面變大變小而影響到整體視覺的美感。

想知道購買電動車哪裡補助最多?台中電動車補助資訊懶人包彙整

節能減碳愛地球是景泰電動車的理念,是創立景泰電動車行的初衷,滿意態度更是服務客戶的最高品質,我們的成長來自於你的推薦。

電動車補助太陽光電發電設備是否會產生噪音?

找對廠商很重要喔,東陽能源是擁有核心技術、產品研發、系統規劃設置、專業團隊的太陽能發電廠商。

最熱情、專業有口碑的網頁設計公司讓您的網站改頭換面。

台中搬家公司教你幾個打包小技巧,輕鬆整理裝箱!

還在煩惱搬家費用要多少哪?台中大展搬家線上試算搬家費用,從此不再擔心「物品怎麼計費」、「多少車才能裝完」

在2022年初Apache OpenNLP 2.0專案發布,目的是要縮小OpenNLP與現代深度學習自然語言處理模型的差距。而在Apache OpenNLP中整合ONNX Runtime,便可以不需要重複模型訓練工作,就能達成此一目標。

在Apache OpenNLP 2.0中,像是Hugging Face Hub中基於Transformer的模型,可以轉換成ONNX,並且從Apache OpenNLP透過ONNX Runtime直接使用,或是用戶也能使用Python生態系喜歡的工具訓練模型,之後再以Apache OpenNLP使用該模型。

Apache OpenNLP不提供任何模型訓練和評估功能,所有的訓練和評估工作,都需要使用者以其他工具和框架完成,同時Apache OpenNLP也不會要求用戶,應用特定的工具和框架創建和評估模型。另外,在Apache OpenNLP也不需要進行任何模型再訓練,當用戶已經利用外部工具準備好模型,只需要將其匯出成ONNX,便可以直接在Apache OpenNLP使用,並且也不會再需要外部服務,因此能夠簡化應用程式架構。

除了文件分類和命名實體辨識等任務外,開發團隊提到,在之後的版本,會繼續對諸如詞性標註和語言偵測等自然語言處理功能,提供OpenNLP介面的ONNX Runtime實作。

https://www.ithome.com.tw/news/153224

您可能也會喜歡…