麻豆传媒直播APP下载_欧美18videosex性欧美黑吊_亚洲成av人片天堂网无码】_日本免费一曲二曲三曲_久久亚洲美女精品国产精品_99精品国产丝袜在线拍国语_丰满的继牳3中文字幕系列免费_成年黄页网站大全免费_伊人久久大香线蕉精品_亚洲成Av人片乱码色午夜麻豆传媒直播APP下载_欧美18videosex性欧美黑吊_亚洲成av人片天堂网无码】_日本免费一曲二曲三曲_久久亚洲美女精品国产精品_99精品国产丝袜在线拍国语_丰满的继牳3中文字幕系列免费_成年黄页网站大全免费_伊人久久大香线蕉精品_亚洲成Av人片乱码色午夜

您的位置:互聯(lián)網(wǎng) > 正文

視頻解析工具Video-ChatGPT上線 可用文本描述視頻內(nèi)容_世界觀察

來源: 時間:2023-05-29 20:56:08

編程客棧()5月29日 消息:雖然像Runway ML這樣的公司在將文本轉(zhuǎn)換為視頻方面取得了長足的進步,但 VideoChatGPT卻另辟蹊徑,賦予語言模型分析視頻的能力。Vide編程客棧o-ChatGPT 可以用文本描述視頻的內(nèi)容,例如,通過突出顯示不尋常的元素來解釋為什么剪輯可能很有趣。

開發(fā)人員通過一段長頸鹿從跳水板上跳入水中的視頻來演示這一點。Video-ChatGPT 指出:“這并不常見,因為長頸鹿并不擅長雜技或潛水?!?/p>


(資料圖)

鏈接到開源語言模型的預訓練視頻編碼器

研究人員將 Video-ChatGPT 的設計描述為簡單且易于擴展。它使用預訓練的視頻編碼器,并將其與預訓練然后微調(diào)的語言模型相結合。

盡管名稱如此,阿布扎比穆罕默德本扎耶德人工智能大學的項目并未使用 OpenAI 技術。相反,研究人員嵌入了一個線性層,將視頻編碼器連接到語言模型。

除了要求特定任務的用戶提示外,語言模型還會使用定義其角色和一般工作的系統(tǒng)命令進行提示。

人機增強數(shù)據(jù)集

研究人員結合使用人工注釋和半自動化方法來生成高質(zhì)量數(shù)據(jù),以微調(diào) Vicuna 模型。這些數(shù)據(jù)的范圍從詳細描述到創(chuàng)造性任務和訪談,涵蓋了各種不同的概念。

總的來說,該數(shù)據(jù)集包含大約86,000個高質(zhì)量的問答,一些由人類注釋,一些由 GPT 模型注釋,一些由圖像分析系統(tǒng)的上下文注釋。

Video-ChatGPT 的核心是其結合視頻理解和文本生成的能力。它在視頻推理、創(chuàng)造android力和對時間和空間php的理解方面的能力已經(jīng)過廣泛測試。

多模態(tài)人工智能未來

在最近文本生成取得重大進展之后,OpenAI 和谷歌等公司正在轉(zhuǎn)向多模態(tài)模型。Bard 理解并可以對圖像做出反應,并在其正式發(fā)布時展示了這些能力。

從圖像到移動圖像編程客棧將是下一個合乎邏輯的步驟。谷歌已經(jīng)宣布開發(fā)一款將于今年晚些時候發(fā)布的 帶有 Project Gemini 的大型多模式 AI 模型。

關鍵詞:

精彩推送

公司

吉卜力工作室如今已加入到主題公園的浪潮,并于11月1日正式對公眾開放全球首個項目,將《龍貓》等經(jīng)典作品的場景復原至現(xiàn)實世界。對于吉卜

詳細>>

隨著在線旅游企業(yè)數(shù)量的不斷增多,售賣不合理低價旅游產(chǎn)品、違規(guī)利用用戶個人信息等問題也時有發(fā)生。11月1日,文旅部發(fā)布《文化和旅游部關

詳細>>

兩個小時,這是越南全國首票榴蓮從裝車到運送至我國廣西崇左友誼關口岸的時間。得益于一體化供應鏈,2021年,中國與越南進出口貿(mào)易額達到23

詳細>>

11月1日,北京商報記者梳理發(fā)現(xiàn),截至9月末,10家A股上市農(nóng)商行資產(chǎn)規(guī)模均有所擴大,重慶農(nóng)商行、上海農(nóng)商行仍以萬億元總資產(chǎn)位居前列。營

詳細>>

西貝餐飲集團(以下簡稱西貝)在兒童餐的道路上越走越深。11月1日,北京商報記者從西貝獲悉,其將推出西貝兒童餐零售產(chǎn)品。目前,部分西貝門

詳細>>

新一期麻辣粉和逆回購操作如期公布。9月15日,央行發(fā)布消息稱,為維護銀行體系流動性合理充裕,開展4000億元中期借貸便利(MLF)操作和20億元

詳細>>