【澳門日報消息】綜合消息,當地時間12月6日,谷歌公司宣佈推出其規模最大、功能最強大的新大型語言模型Gemini。在32項性能測試標準中,Gemini有30項得分超過了GPT-4。在MMLU(大規模多工語言理解)測試中,Gemini Ultra以90.0%的高分,首次超過了人類專家。
Gemini包括一套三種不同規模的模型。Gemini Ultra——谷歌參數量最大、性能最強的模型,適用於高度複雜的任務;Gemini Pro——可擴展各種任務的模型;Gemini Nano——高效的設備端任務模型。Gemini系列模型主打多模態、靈活性兩個能力。
官網將Gemini定義為一款“原生多模態”模型。可以理解為Gemini的出廠設置就是“全科發展”,多種感官在模型內統一學習,而不是單獨學習再拼接到一起——後者是GPT等模型採用的標準做法,有可能帶來“偏科”問題,也就是更擅長處理文字或者圖片。這就意味著Gemini可以直接理解不同類型的信息,包括文本、代碼、音頻、圖像和視頻,不需要額外的轉換,各種模態的性能也更為平衡。
官網介紹,原生多模態能力讓Gemeni能夠“回答更複雜的問題”,特別擅長解釋數學和物理等複雜學科的推理。在衡量模型處理文本和圖像的能力的MMLU測試中,Gemini Ultra的得分高達90.0%,首次超越了人類專家。在32項性能測試標準中,Gemini有30項得分超過了GPT-4,不過大多差距很小。
靈活性方面,谷歌推出了更多模型應用的選擇。比如Gemini Nano作為最輕的模型,適用於內存空間有限的移動設備。該模型將在12月首次內置於谷歌手機Pixel 8 Pro,支持錄音自動摘要、鍵盤智能回覆兩項功能,未來預計將更多功能置於安卓手機離線運行。谷歌表示,Gemini將出現在更多的產品和服務中,例如谷歌搜索、廣告營銷、Chrome瀏覽器和Duet AI。
留言