<strong id="uznde"><ol id="uznde"></ol></strong>

    <ins id="uznde"><legend id="uznde"><font id="uznde"></font></legend></ins>
    <bdo id="uznde"><ol id="uznde"></ol></bdo>
  • <listing id="uznde"><s id="uznde"></s></listing>
  • <ruby id="uznde"><table id="uznde"></table></ruby>
  • <ins id="uznde"></ins>
    歡迎您訪問意昂2官方網站!
    服務熱線:020-123456789
    • 產品
    • 文章

    NEWS CENTER

    新聞中心

    當前位置:首頁 > 產品中心

    媲美Sora的視頻大模型,“95后”清華博士研發!

    來源:意昂2  更新時間:2024-08-24 15:46:01


    不需要復雜5后指令

    僅僅輸入一段文字描述

    嚴絲合縫的代碼便會為你構建起

    一幀幀栩栩如生的影像

    2024年4月

    媲美Sora的首個國產自研

    視頻生成大模型Vidu

    出現在大眾視野

    支持一鍵生成

    16秒、1080P的媲美頻視頻

    帶領團隊完成這項工作的

    是清華大學計算機系博士生鮑凡

    畢業后他即將擔任

    AI創業公司的首席技術官

    在追求極致的過程中

    持續探尋技術最本質的樂趣

    零基礎跨專業

    結緣人工智能

    2014年

    鮑凡被清華大學

    生命科學學院錄取

    在開展諸多生物實驗的同時

    他也開始自學計算機編程

    鮑凡(左一)和同學討論問題

    學習的過程中

    鮑凡逐漸發現

    偏理論的計算機學習

    對自己有著更大的吸引力

    “可能這是一個很復雜的系統

    但是一旦深入其中,你會發現

    這里面本質的模型東西非常簡潔優雅”

    無論是數學公式推導

    把公式變成可執行的代碼

    還是收集、訓練數據

    在鮑凡看來

    每一個環節都充滿著魅力

    如何通過自學掌握跨學科知識?

    鮑凡有著自己的清華一套方法

    “將不同的知識整理到

    我自己定義的語言體系中

    沒有直接復制粘貼

    所有的定理

    都被我一個個證明過”

    鮑凡記錄的部分筆記

    數百頁的筆記

    見證著少年的勤奮與努力

    靠著這種學習方式

    鮑凡在大一到大二期間

    掌握了豐富的計算機知識

    順利通過轉專業的考核

    進入計算機系

    清華十年

    開展純粹的科研

    “我覺得清華實驗室的

    學術科研氛圍很濃厚

    所以決定繼續留在學校

    純粹地去做科研”

    本科畢業時

    鮑凡憑借出色的成績獲得了

    免試攻讀博士學位研究生的機會

    鮑凡(中)與導師張鈸院士(右)、朱軍教授

    讀博期間

    他師從張鈸院士、博士朱軍教授

    先后在ICML5后NeurIPS、媲美頻ICLR、模型CVPR等

    計算機領域頂級會議

    以第一作者的清華身份

    發表8篇高水平論文

    其中有關擴散概率模型的論文

    獲得機器學習領域頂級會議

    ICLR 2022杰出論文獎

    成為該會議首篇

    由中國大陸單位獨立完成的獲獎論文

    鮑凡獲得ICLR2022杰出論文獎

    該成果被人工智能公司OpenAI

    作為核心技術應用于

    超大規??缒B生成模型DALL·E 2

    產生了廣泛的影響力

    回憶起十年求學生涯

    鮑凡感慨

    “清華園的每個人

    都全力以赴地投身于工作

    我也逐漸融入到了

    這個務實進取的群體中

    變得更加穩重和踏實”

    從論文到產品

    首個國產視頻大模型誕生

    “很多時候人跨境界的提升

    都需要有一次把自己逼到極限的過程”

    導師朱軍教授的這句話

    給鮑凡留下了深刻的印象

    在科研攻關的過程中

    他也曾“無數次被逼到極限”

    Vidu是鮑凡和團隊成員采用

    原創架構U-ViT研發出的

    中國首個長時長、高一致性、博士高動態性

    視頻生成大模型

    與OpenAI發布5后

    以DiT為底層架構的大模型Sora

    有著一致的架構路線

    與網絡上將Vidu視為

    國外視頻大模型Sora的追趕者不同

    有業內人士認為

    “Vidu并不屬于追逐 Sora 的一員

    而是一早就踏在了同一起跑線

    甚至是更早”

    事實上,2022年9月

    鮑凡就率先提出了全球首個

    擴散模型與Transformer模型的媲美頻融合架構U-ViT

    成果發表在了計算機視覺頂級會議上

    早于Sora采用的DiT架構的提出時間

    ——2022年12月

    然而在產品上

    OpenAI卻領先一步

    2024年2月Sora問世

    鮑凡意識到

    U-ViT也有著廣闊的應用前景

    他非常果斷地做出決策

    “要做中國自己的視頻大模型!”

    制定整體的模型計劃與分工

    設計出算法和模型的框架

    在攻關期間深入到每一個細節里

    不分晝夜抓進度,加班加點趕工程

    兩個月后

    鮑凡帶領團隊完成的清華

    文本生成視頻大模型Vidu

    出現在大眾視野

    由Vidu生成的畫面

    汽車穿過林間小路

    玩具船在起伏的地毯上航行

    湖邊,熊貓正彈奏吉他

    帶著珍珠項鏈的博士橘貓回眸

    ……

    支持一鍵生成

    16秒、1080P視頻的Vidu

    性能全面對標國際頂尖水平

    不僅可以復刻現實世界

    還能生成想象中的虛構畫面

    《新聞聯播》報道Vidu

    發布后獲得央視《新聞聯播》

    《東方時空》《新聞30分》

    等多個欄目的報道

    在海外社交平臺也擁有百萬討論量

    包括TechTimes(《科技時報》)在內的

    多家媒體都對其進行了介紹

    如今的Vidu

    還未停止迭代升級的腳步

    理解用戶更為復雜的需求

    生成更加令人滿意的視頻

    鮑凡將和團隊成員一起

    探尋視頻大模型的更多可能

    邊學術邊創業

    畢業后成為首席技術官

    在清華大學

    濃厚的創新創業氛圍影響下

    讀博期間

    鮑凡踏上了創業之路

    他的創業契機很純粹

    “就是希望能夠做出偉大的模型”

    “開始我也有考慮過走學術路線

    但是回歸到自己的目標

    我希望掌握透大模型里面的每一個細節

    以這個目標來看的話

    確實只有創業才有這種機會”

    鮑凡(右一)與朱軍教授討論問題

    畢業之后

    鮑凡將在生數科技擔任首席技術官

    帶領著團隊繼續開展

    視頻生成模型的研發工作

    希望能在現有基礎上

    讓大模型變得更加通用可控

    關于未來

    鮑凡認為Vidu能做的

    不僅僅是生成視頻

    在虛擬世界復刻物理規律

    應用于各種各樣的學科中

    “為世界建?!?/p>

    是團隊的終極目標

    鮑凡在大禮堂前

    從羅姆樓、大禮堂

    到二校門、東升大廈

    采訪結束已經到了晚上九點

    鮑凡又回到了他的工作崗位

    還有一些緊迫的任務

    在等待著他去完成

    代碼交織,光影變幻

    鮑凡的身影消融在夜色里

    從清華起步

    助力中國大模型邁向世界舞臺

    一段嶄新的旅程

    已經開啟

     


    相關文章
    亚洲精品第一国产综合高清|中文字幕一区二区精品区|国产高清在线精品一区免费97|69久久久久精品9999不卡片
    <strong id="uznde"><ol id="uznde"></ol></strong>

    <ins id="uznde"><legend id="uznde"><font id="uznde"></font></legend></ins>
    <bdo id="uznde"><ol id="uznde"></ol></bdo>
  • <listing id="uznde"><s id="uznde"></s></listing>
  • <ruby id="uznde"><table id="uznde"></table></ruby>
  • <ins id="uznde"></ins>