性感美女揉胸视频,超性感美女视频

迄今“最強大”、碾壓GPT4……谷歌AI大模型問世，馬斯克也點贊！股價大漲

來源：證券時報網(wǎng)作者：周春媚2023-12-07 22:52

當?shù)貢r間12月6日，美國科技公司谷歌推出了Gemini大模型。與大語言模型ChatGPT不同，Gemini大模型是原生多模態(tài)大模型，不僅可以處理文本內(nèi)容，還可以無縫絲滑地處理代碼、音頻、圖像和視頻等多種模態(tài)的信息。據(jù)介紹，這是谷歌目前規(guī)模最大、能力最強的大模型。

Gemini大模型一經(jīng)推出，便引發(fā)了科技圈的“地震”，業(yè)內(nèi)多名人士都對Gemini大模型表達了祝賀與贊美。根據(jù)谷歌給出的基準測試結(jié)果，Gemini大模型在大部分測試當中都打敗了OpenAI的ChatGPT4，顯示了先進的性能。

今日美股盤前，谷歌A、谷歌C均大幅上漲，一度漲約4%。開盤后，谷歌股價保持高位，截至發(fā)稿，谷歌A漲4.88%，谷歌C漲超5%。

主打“原生多模態(tài)”，30項測試結(jié)果超越GPT4

“Gemini 是我們迄今為止最強大、最通用的模型，它在許多領(lǐng)先的基準測試中都展現(xiàn)出了最先進的性能。”在Gemini大模型發(fā)布的公開信中，谷歌CEO桑達爾·皮查伊如此說道。谷歌DeepMind的CEO和聯(lián)合創(chuàng)始人德米斯·哈薩比斯代表團隊對Gemini大模型進行了詳細介紹。

綜合來看，谷歌此次發(fā)布的Gemini大模型主要有以下幾個亮點：

三個版本：提供三種不同的尺寸，實現(xiàn)從云上到手機、平板都可以運行。據(jù)谷歌介紹，尺寸由大至小分別為Gemini Ultra（規(guī)模最大且功能最強大，適用于高度復雜的任務(wù)）、Gemini Pro（適用于各種任務(wù)的最佳模型）和Gemini Nano（端側(cè)設(shè)備上最高效的模型）。

多種模態(tài)：據(jù)介紹，Gemini大模型從一開始就被創(chuàng)建為多模態(tài)的模型，這意味著它可以歸納并流暢地理解、操作以及組合不同類型的信息，包括文本、代碼、音頻、圖像和視頻。

性能卓越：性能測試方面，在32項性能基準測試中的30項上，Gemini Ultra模型超越了現(xiàn)有最先進的GPT4。其中，在MMLU（大規(guī)模多任務(wù)語言理解）測試中，Gemini Ultra以90.0%的成績首次超過了人類專家。

具備更強的理解、推理和編碼能力：可以在海量的數(shù)據(jù)中發(fā)掘難以辨別的知識內(nèi)容；尤其擅長解釋數(shù)學和物理等復雜科目中的推理；可以理解、解釋和生成世界上最流行的編程語言（如 Python、Java、C++ 和 Go）的高質(zhì)量代碼，能夠跨語言工作并對復雜信息進行推理，這些能力使其成為世界領(lǐng)先的編碼基礎(chǔ)模型之一。

以上這些亮點中，多模態(tài)信息識別、理解與處理能力無疑是谷歌Gemini大模型最令人感到驚艷的一個能力。在一個測評視頻中，測評人讓Gemini看一系列的影像，并要求Gemini推理所看到的內(nèi)容。記者看到，當測評人繪制一幅圖片的時候，Gemini可以實時描述它所“看”到的畫面。更奇妙的是，當測評人展示兩張斜坡上的車輛圖片，問“從設(shè)計上看，哪個車會跑得更快？”時，Gemini會問答：“右邊的車更快，它更符合空氣動力學?！?/p>

Gemini大模型卓越的性能引得科技圈人士紛紛點贊。比如，特斯拉CEO埃隆·馬斯克在桑達爾·皮查伊在社交平臺X上的發(fā)布帖下評論稱：“令人印象深刻?！背艘酝?，馬斯克還對谷歌DeepMind的CEO、Gemini團隊代表德米斯·哈薩比斯表示了祝賀。

AI進入多模態(tài)時代，帶動算力賽道持續(xù)繁榮

一名人工智能研發(fā)人員向記者表示，谷歌Gemini模型的核心優(yōu)勢在于其原生多模態(tài)的特性。具體而言，以往的多模態(tài)大模型是通過針對不同模態(tài)訓練單獨的組件，然后把這些組件組合起來，模擬多模態(tài)功能。雖然在單獨和具體的任務(wù)上表現(xiàn)良好，但在處理需要更深層次概念理解和復雜推理的任務(wù)時，表現(xiàn)往往不盡人意。

“不像OpenAI那樣為圖像和語音訓練獨立的DALL-E和Whisper模型，谷歌從一開始就構(gòu)建了一個多感官模型?！痹撗邪l(fā)人員表示。

近期，以語音、圖片、視頻等為主要代表的多模態(tài)大模型站上風口。記者梳理發(fā)現(xiàn)，多家國內(nèi)外科技公司密集發(fā)布了相關(guān)產(chǎn)品。

語音方面，11月22日，Meta官網(wǎng)發(fā)出公告，推出了一款多語言和多任務(wù)模型SeamlessM4T，可用于無縫翻譯和轉(zhuǎn)錄語音和文本。據(jù)悉，SeamlessM4T的主要能力包括自動識別近百種語言的語音、語音翻譯、文本轉(zhuǎn)語音翻譯等。

圖像及視頻方面，11月16日，Meta官網(wǎng)發(fā)布文生視頻模型Emu Video和圖像編輯模型Emu Edit。11月29日，美國初創(chuàng)公司Pika Labs發(fā)布了文生視頻工具Pika1.0，支持對視頻進行實時編輯和修改；12月5日，美圖發(fā)布AI視覺大模型MiracleVision的4.0版本，新增AI設(shè)計與AI視頻兩大能力。其中，AI設(shè)計具備四大功能，包括矢量圖形、文字特效、智能分層和智能排版，可以滿足AI設(shè)計的基礎(chǔ)需求。

業(yè)內(nèi)人士普遍認為，多模態(tài)是生成式AI下一步的重點方向，百花齊放的應(yīng)用場景有待繼續(xù)探索。東方證券研報認為，現(xiàn)階段大語言模型的競爭已經(jīng)非常激烈，從技術(shù)突破的角度來看，下一階段的重點攻克方向必然是多模態(tài)技術(shù)。能夠真正處理和應(yīng)用好多模態(tài)AI能力，才能真正打通物理世界和數(shù)字世界的障壁，用最基礎(chǔ)的感知世界能力直接生成操作，實現(xiàn)與物理世界最自然的交互。

中信證券研報指出，隨著谷歌Gemini模型發(fā)布，AI進入多模態(tài)時代。短期來看，Gemini的發(fā)布將進一步激發(fā)市場對多模態(tài)模型的期待，對產(chǎn)業(yè)而言，多模態(tài)料將帶動算力需求的提升；而在中長期來看，預計多模態(tài)模型的升級將豐富相關(guān)產(chǎn)品的使用場景，疊加硬件升級、算法優(yōu)化帶來的成本優(yōu)化，2C產(chǎn)品的進展值得期待。持續(xù)看好本輪生成式AI浪潮對科技產(chǎn)業(yè)的長周期影響和改變，繼續(xù)關(guān)注算力、算法、數(shù)據(jù)、應(yīng)用等環(huán)節(jié)的領(lǐng)先廠商。

不過，相比于大語言模型，多模態(tài)大模型對算力的消耗呈指數(shù)級增長趨勢。國泰君安研報認為：當前多模態(tài)大模型仍在不斷迭代，訓練階段的算力將保持增長。根據(jù)測算，GPT4對于算力的需求在同等訓練時長下相比GPT3增長445倍。訓練成本持續(xù)高企，算力租賃商業(yè)模式具備可行性，短期持續(xù)看好算力以及算力租賃賽道。

校對：彭其華

責任編輯：高蕊琦

谷歌

馬斯克

聲明：證券時報力求信息真實、準確，文章提及內(nèi)容僅供參考，不構(gòu)成實質(zhì)性投資建議，據(jù)此操作風險自擔

下載“證券時報”官方APP，或關(guān)注官方微信公眾號，即可隨時了解股市動態(tài)，洞察政策信息，把握財富機會。

網(wǎng)友評論

登錄后可以發(fā)言

發(fā)送

網(wǎng)友評論僅供其表達個人看法，并不表明證券時報立場