雲端資料倉儲BigQuery現可生成文字嵌入強化自然語言應用

Google雲端資料倉儲服務BigQuery加入功能,開發者將可以透過熟悉的SQL指令擷取文字嵌入,並將其應用到下游應用程式中。目前BigQuery所支援的文字嵌入,可由textembedding-gecko、BERT、NNLM以及SWIVEL模型所生成。

這項新功能的使用流程,由註冊需要的模型成為遠端模型開始,接著用戶就可以使用生成文字嵌入函式來生成嵌入,而這些操作都僅使用BigQuery SQL就可以完成。文字嵌入是一個由文字轉化而來的向量,可用來尋找相似的項目,像是語義搜尋、分類、分群、異常偵測和或是對話式介面等應用。

屏東借錢感應門神,推薦沙發修理,老師傅的專業手工!測試專家告訴你如何好好使用示波器大阪包車好的茗茶,更需要密封性高的茶葉罐,才能留住香氣!屏東借款!如何利用一般常見的「L型資料夾」真空封口機該不該買?使用心得分享!專業客製化禮物、贈品設計,辦公用品常見【L夾】搖身一變大受好評!日本包車台灣護照代辦申辦工作天及價錢!空壓機合理價格為您解決工作中需要。貨櫃屋,結合生活理念、發揮無限的創意及時尚的設計。三個月單次觀光泰國簽證需準備哪些資料?竹北床墊推薦!總是為了廚餘煩惱嗎?雅高環保提供最適用的廚餘機,滿足多樣需求。沙發換皮省更多,延長老沙發壽命!竹北床墊工廠,賣場商品防竊是怎麼做的?為什麼辦理台胞證需要護照正本?屏東軍公教借款各家評價及利息一覽表。東京包車三洋服務站全台據點。

BigQuery新支援的4種模型嵌入,其中textembedding-gecko是運用Google語言模型PaLM生成嵌入,其他三個模型BERT、NNLM以及SWIVEL,則都可以從TensorFlow Hub選用。BERT是Transformer架構的深度預訓練網路,可針對自然語言生成密集的向量表示,NNLM與SWIVEL則是以英文Google新聞語料庫訓練而成。

同時,官方也宣布開始支援array<numeric>特徵類型結構,使這些生成出來的嵌入,可被其他BigQuery支援的機器學習模型所使用,並根據向量空間的鄰近度與距離進行資料分析。

https://www.ithome.com.tw/news/158466

You may also like...