超越Sora！阿里萬相大模型宣佈開源

新浪科技

2025/02/25

　　新浪科技訊 2月25日晚間消息，阿里雲宣佈旗下視覺生成基座模型萬相2.1（Wan）開源，此次開源採用最寬鬆的Apache2.0協議，14B和1.3B兩個參數規格的全部推理代碼和權重全部開源，同時支持文生視頻和圖生視頻任務，全球開發者可在Github、HuggingFace和魔搭社區下載體驗。

　　據介紹，14B萬相模型在指令遵循、複雜運動生成、物理建模、文字視頻生成等方面表現突出，在權威評測集VBench中，萬相2.1以總分86.22%的成績超越Sora、Luma、Pika等國內外模型，穩居榜首位置。1.3B版本測試結果不僅超過了更大尺寸的開源模型，甚至還接近部分閉源模型，同時能在消費級顯卡運行，僅需8.2GB顯存就可以生成高質量視頻，適用於二次模型開發和學術研究。

　　在算法設計上，萬相基於主流DiT架構和線性噪聲軌跡Flow Matching範式，研發了高效的因果3D VAE、可擴展的預訓練策略等。以3D VAE為例，為了高效支持任意長度視頻的編碼和解碼，萬相在3D VAE的因果卷積模塊中實現了特徵緩存機制，從而代替直接對長視頻端到端的編解碼過程，實現了無限長1080P視頻的高效編解碼。此外，通過將空間降採樣壓縮提前，在不損失性能的情況下進一步減少了29%的推理時內存佔用。

　　萬相團隊的實驗結果顯示，在運動質量、視覺質量、風格和多目標等14個主要維度和26個子維度測試中，萬相均達到了業界領先表現，並且斬獲5項第一。（文猛）

海量資訊、精準解讀，盡在新浪財經APP

責任編輯：何俊熹

免責聲明：投資有風險，本文並非投資建議，以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請，作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考，不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證，投資者應自行研究並在投資前尋求專業建議。

熱議股票

1
2
3
4
5
6
7
8
9
10

{"basename":"/hant","ssrTDKData":{"titleTemplate":"%s - 老虎證券","title":"老虎证券全球投资理财平台| 一站式投资美股新股港股A股","description":"老虎证券助您一站式投资美股，新股，港股，A股等全球金融理财产品。新加坡华人最信赖的在线投资平台，现在加入即享低费用，24/5 无时差炒美股投资理财！","keywords":"老虎證券,老虎證券開戶,老虎券商,老虎證券官網,老虎證券app,tigertrade老虎證券,股票,炒股,新加坡股票交易平臺,投資,投資理財","social":{"ogDescription":"老虎证券助您一站式投资美股，新股，港股，A股等全球金融理财产品。新加坡华人最信赖的在线投资平台，现在加入即享低费用，24/5 无时差炒美股投资理财！","ogImage":"https://c1.itigergrowtha.com/portal5/static/media/og-logo.be62fbe1.png","ogUrl":"https://www.itiger.com/hant/news/2514018828"},"companyName":"老虎證券"},"pageData":{"isMobile":false,"isTiger":false,"isTTM":true,"region":"SGP","license":"TBSG","edition":"fundamental"},"isCrawlerRequest":true,"__swrFallback__":{"@#url:\"https://stock-news.skytigris.cn/v3/news\",params:#id:\"2514018828\",edition:\"fundamental\",auth_exemption:1,,,undefined,":{"share":"https://ttm.financial/m/news/2514018828?lang=zh_TW&edition=fundamental","thumbnail":"","is_english":false,"pubTime":"2025-02-25 22:38","share_image_url":"https://static.laohu8.com/b0d1b7e8843deea78cc308b15114de44","id":"2514018828","market":"hk","top_or_hot":-1,"title":"超越Sora！阿里萬相大模型宣佈開源","media":"新浪科技","content":"<html><body><div>\n<div><img src=\"http://n.sinaimg.cn/finance/transform/52/w550h302/20250225/04be-6625c8509ef65075fb230b03f4ceb49e.png\"/><span></span></div>\n<p>　　新浪科技訊 2月25日晚間消息，阿里雲宣佈旗下視覺生成基座模型萬相2.1（Wan）開源，此次開源採用最寬鬆的Apache2.0協議，14B和1.3B兩個參數規格的全部推理代碼和權重全部開源，同時支持文生視頻和圖生視頻任務，全球開發者可在Github、HuggingFace和魔搭社區下載體驗。</p>\n<p>　　據介紹，14B萬相模型在指令遵循、複雜運動生成、物理建模、文字視頻生成等方面表現突出，在權威評測集VBench中，萬相2.1以總分86.22%的成績超越Sora、Luma、Pika等國內外模型，穩居榜首位置。1.3B版本測試結果不僅超過了更大尺寸的開源模型，甚至還接近部分閉源模型，同時能在消費級顯卡運行，僅需8.2GB顯存就可以生成高質量視頻，適用於二次模型開發和學術研究。</p>\n<p>　　在算法設計上，萬相基於主流DiT架構和線性噪聲軌跡Flow Matching範式，研發了高效的因果3D VAE、可擴展的預訓練策略等。以3D VAE為例，為了高效支持任意長度視頻的編碼和解碼，萬相在3D VAE的因果卷積模塊中實現了特徵緩存機制，從而代替直接對長視頻端到端的編解碼過程，實現了無限長1080P視頻的高效編解碼。此外，通過將空間降採樣壓縮提前，在不損失性能的情況下進一步減少了29%的推理時內存佔用。</p>\n<p>　　萬相團隊的實驗結果顯示，在運動質量、視覺質量、風格和多目標等14個主要維度和26個子維度測試中，萬相均達到了業界領先表現，並且斬獲5項第一。（文猛）</p>\n<div>\n<div><img src=\"\"/></div>\n<div>海量資訊、精準解讀，盡在新浪財經APP</div>\n</div>\n<p>責任編輯：何俊熹 </p>\n</div></body></html>","source":"sina","html":"<!DOCTYPE html>\n<html>\n<head>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />\n<meta name=\"viewport\" content=\"width=device-width,initial-scale=1.0,minimum-scale=1.0,maximum-scale=1.0,user-scalable=no\"/>\n<meta name=\"format-detection\" content=\"telephone=no,email=no,address=no\" />\n<title>超越Sora！阿里萬相大模型宣佈開源</title>\n<style type=\"text/css\">\na,abbr,acronym,address,applet,article,aside,audio,b,big,blockquote,body,canvas,caption,center,cite,code,dd,del,details,dfn,div,dl,dt,\nem,embed,fieldset,figcaption,figure,footer,form,h1,h2,h3,h4,h5,h6,header,hgroup,html,i,iframe,img,ins,kbd,label,legend,li,mark,menu,nav,\nobject,ol,output,p,pre,q,ruby,s,samp,section,small,span,strike,strong,sub,summary,sup,table,tbody,td,tfoot,th,thead,time,tr,tt,u,ul,var,video{ font:inherit;margin:0;padding:0;vertical-align:baseline;border:0 }\nbody{ font-size:16px; line-height:1.5; color:#999; background:transparent; }\n.wrapper{ overflow:hidden;word-break:break-all;padding:10px; }\nh1,h2{ font-weight:normal; line-height:1.35; margin-bottom:.6em; }\nh3,h4,h5,h6{ line-height:1.35; margin-bottom:1em; }\nh1{ font-size:24px; }\nh2{ font-size:20px; }\nh3{ font-size:18px; }\nh4{ font-size:16px; }\nh5{ font-size:14px; }\nh6{ font-size:12px; }\np,ul,ol,blockquote,dl,table{ margin:1.2em 0; }\nul,ol{ margin-left:2em; }\nul{ list-style:disc; }\nol{ list-style:decimal; }\nli,li p{ margin:10px 0;}\nimg{ max-width:100%;display:block;margin:0 auto 1em; }\nblockquote{ color:#B5B2B1; border-left:3px solid #aaa; padding:1em; }\nstrong,b{font-weight:bold;}\nem,i{font-style:italic;}\ntable{ width:100%;border-collapse:collapse;border-spacing:1px;margin:1em 0;font-size:.9em; }\nth,td{ padding:5px;text-align:left;border:1px solid #aaa; }\nth{ font-weight:bold;background:#5d5d5d; }\n.symbol-link{font-weight:bold;}\n/* header{ border-bottom:1px solid #494756; } */\n.title{ margin:0 0 8px;line-height:1.3;color:#ddd; }\n.meta {color:#5e5c6d;font-size:13px;margin:0 0 .5em; }\na{text-decoration:none; color:#2a4b87;}\n.meta .head { display: inline-block; overflow: hidden}\n.head .h-thumb { width: 30px; height: 30px; margin: 0; padding: 0; border-radius: 50%; float: left;}\n.head .h-content { margin: 0; padding: 0 0 0 9px; float: left;}\n.head .h-name {font-size: 13px; color: #eee; margin: 0;}\n.head .h-time {font-size: 12.5px; color: #7E829C; margin: 0;}\n.small {font-size: 12.5px; display: inline-block; transform: scale(0.9); -webkit-transform: scale(0.9); transform-origin: left; -webkit-transform-origin: left;}\n.smaller {font-size: 12.5px; display: inline-block; transform: scale(0.8); -webkit-transform: scale(0.8); transform-origin: left; -webkit-transform-origin: left;}\n.bt-text {font-size: 12px;margin: 1.5em 0 0 0}\n.bt-text p {margin: 0}\n</style>\n</head>\n<body>\n<div class=\"wrapper\">\n<header>\n<h2 class=\"title\">\n超越Sora！阿里萬相大模型宣佈開源\n</h2>\n<h4 class=\"meta\">\n<p class=\"head\">\n<strong class=\"h-name small\">新浪科技</strong><span class=\"h-time small\">2025-02-25 22:38</span>\n</p>\n</h4>\n</header>\n<article>\n<html><body><div>\n<div><img src=\"http://n.sinaimg.cn/finance/transform/52/w550h302/20250225/04be-6625c8509ef65075fb230b03f4ceb49e.png\"/><span></span></div>\n<p>　　新浪科技訊 2月25日晚間消息，阿里雲宣佈旗下視覺生成基座模型萬相2.1（Wan）開源，此次開源採用最寬鬆的Apache2.0協議，14B和1.3B兩個參數規格的全部推理代碼和權重全部開源，同時支持文生視頻和圖生視頻任務，全球開發者可在Github、HuggingFace和魔搭社區下載體驗。</p>\n<p>　　據介紹，14B萬相模型在指令遵循、複雜運動生成、物理建模、文字視頻生成等方面表現突出，在權威評測集VBench中，萬相2.1以總分86.22%的成績超越Sora、Luma、Pika等國內外模型，穩居榜首位置。1.3B版本測試結果不僅超過了更大尺寸的開源模型，甚至還接近部分閉源模型，同時能在消費級顯卡運行，僅需8.2GB顯存就可以生成高質量視頻，適用於二次模型開發和學術研究。</p>\n<p>　　在算法設計上，萬相基於主流DiT架構和線性噪聲軌跡Flow Matching範式，研發了高效的因果3D VAE、可擴展的預訓練策略等。以3D VAE為例，為了高效支持任意長度視頻的編碼和解碼，萬相在3D VAE的因果卷積模塊中實現了特徵緩存機制，從而代替直接對長視頻端到端的編解碼過程，實現了無限長1080P視頻的高效編解碼。此外，通過將空間降採樣壓縮提前，在不損失性能的情況下進一步減少了29%的推理時內存佔用。</p>\n<p>　　萬相團隊的實驗結果顯示，在運動質量、視覺質量、風格和多目標等14個主要維度和26個子維度測試中，萬相均達到了業界領先表現，並且斬獲5項第一。（文猛）</p>\n<div>\n<div><img src=\"\"/></div>\n<div>海量資訊、精準解讀，盡在新浪財經APP</div>\n</div>\n<p>責任編輯：何俊熹 </p>\n</div></body></html>\n<div class=\"bt-text\">\n\n\n<p> 來源：<a href=\"https://finance.sina.com.cn/tech/2025-02-25/doc-inemtimv4269421.shtml\">新浪科技</a></p>\n<p>為提升您的閱讀體驗，我們對本頁面進行了排版優化</p>\n\n\n</div>\n</article>\n</div>\n</body>\n</html>\n","isBrief":false,"type":0,"news_type":1,"symbol":"BK4122","symbol_name":"互聯網與直銷零售","start_time":0,"source_url":"https://finance.sina.com.cn/tech/2025-02-25/doc-inemtimv4269421.shtml","article_id":"2514018828","we_media_id":null,"thumbnails":[],"rights":null,"url":"https://stock-news.laohu8.com/highlight/detail?id=2514018828","pubTimestamp":1740494280,"columns":[],"sourceInfo":{"source_id":"sina","name":"sina"},"weMediaInfo":null,"summary":"新浪科技訊 2月25日晚間消息，阿里雲宣佈旗下視覺生成基座模型萬相2.1 開源，此次開源採用最寬鬆的Apache2.0協議，14B和1.3B兩個參數規格的全部推理代碼和權重全部開源，同時支持文生視頻和圖生視頻任務，全球開發者可在Github、HuggingFace和魔搭社區下載體驗。　　據介紹，14B萬相模型在指令遵循、複雜運動生成、物理建模、文字視頻生成等方面表現突出，在權威評測集VBench中，萬相2.1以總分86.22%的成績超越Sora、Luma、Pika等國內外模型，穩居榜首位置。","collect":0,"end_time":0,"defaultTopTitle":"sina.com.cn","property":[],"viewcount":null,"language":"zh","relate_stocks":{"BK4122":"互联网与直销零售","LU0821914370.USD":"贝莱德亚洲成长领袖A2","LU1282648689.USD":"ALLIANZ TOTAL RETURN ASIAN EQUITY \"AMG\" (USD) INC","LU0348816934.USD":"ALLIANZ TOTAL RETURN ASIAN EQUITY \"AT\" (USD)","BK4502":"阿里概念","BK4575":"芯片概念","BK4587":"ChatGPT概念","LU1046422090.SGD":"Fidelity Pacific A-SGD","LU0251143458.SGD":"Fidelity Emerging Markets A-SGD","BK4505":"高瓴资本持仓","BK4535":"淡马锡持仓","LU0128525689.USD":"TEMPLETON GLOBAL BALANCED \"A\"(USD) ACC","BK4504":"桥水持仓","BK4538":"云计算","LU0067412154.USD":"UBS (LUX) EQUITY FUND -  CHINA OPPORTUNITY \"P\" (USD) ACC","LU0501845795.SGD":"瑞银大中华区股票基金P Acc SGD","LU0052756011.USD":"TEMPLETON GLOBAL BALANCED \"A\" (USD) INC","BK4579":"人工智能","LU0310800965.SGD":"FTIF - Templeton Global Balanced A Acc SGD","BK4588":"碎股","09988":"阿里巴巴-W","LU1152091754.HKD":"UBS (LUX) EQUITY FUND - CHINA OPPORTUNITY (USD) \"PM\" (HKD) INC","BK4548":"巴美列捷福持仓","LU0651946864.USD":"贝莱德新兴市场股票收益A2","LU1880383366.USD":"东方汇理中国股票基金 A2 (C)","LU2226246903.HKD":"ALLIANZ TOTAL RETURN ASIAN EQUITY \"AT4\" (HKD) ACC","BK4565":"NFT概念","LU1051768304.USD":"贝莱德新兴市场股票收益A6","LU0072913022.USD":"UBS (LUX) EQUITY FUND -  GREATER CHINA \"P\" (USD) ACC","LU1008478684.HKD":"UBS (LUX) EQUITY FUND -  CHINA OPPORTUNITY \"P\" (HKD) ACC","BK4607":"DeepSeek概念股","LU0797268264.HKD":"ALLIANZ TOTAL RETURN ASIAN EQUITY \"AT\" (HKD) ACC","BABA":"阿里巴巴","LU1515016050.SGD":"Blackrock Emerging Markets Equity Income A6 SGD-H","BK4524":"宅经济概念","BK4581":"高盛持仓","LU0880133367.SGD":"UBS (LUX) EQUITY FUND CHINA OPPORTUNITY USD \"P\" (SGD) ACC","BK4543":"AI","LU1105468828.SGD":"Allianz Total Return Asian Equity AM DIS H2-SGD","BK4527":"明星科技股","BK4531":"中概回港概念","IE00B0JY6N72.USD":"PINEBRIDGE GLOBAL EMERGING MARKETS FOCUS EQUITY \"A\" (USD) ACC","BK4526":"热门中概股","BK4585":"ETF&股票定投概念","LU0918141887.USD":"安联亚洲实际收益股票基金","LU0918141705.HKD":"ALLIANZ TOTAL RETURN ASIAN EQUITY \"AM\" (HKD) INC","BK4534":"瑞士信贷持仓","LU0348814723.USD":"ALLIANZ TOTAL RETURN ASIAN EQUITY \"A\" (USD) INC  NC","LU1048596156.SGD":"Blackrock Asian Growth Leaders A2 SGD-H","BK4503":"景林资产持仓"},"translate_title":"Beyond Sora! Alibaba Wanxiang large model announced open source","themeId":null,"isJumpTheme":false,"ttsUrl":null,"symbols_score_info":{"09988":0.6,"BABA":1},"content_text":"新浪科技訊 2月25日晚間消息，阿里雲宣佈旗下視覺生成基座模型萬相2.1（Wan）開源，此次開源採用最寬鬆的Apache2.0協議，14B和1.3B兩個參數規格的全部推理代碼和權重全部開源，同時支持文生視頻和圖生視頻任務，全球開發者可在Github、HuggingFace和魔搭社區下載體驗。\n　　據介紹，14B萬相模型在指令遵循、複雜運動生成、物理建模、文字視頻生成等方面表現突出，在權威評測集VBench中，萬相2.1以總分86.22%的成績超越Sora、Luma、Pika等國內外模型，穩居榜首位置。1.3B版本測試結果不僅超過了更大尺寸的開源模型，甚至還接近部分閉源模型，同時能在消費級顯卡運行，僅需8.2GB顯存就可以生成高質量視頻，適用於二次模型開發和學術研究。\n　　在算法設計上，萬相基於主流DiT架構和線性噪聲軌跡Flow Matching範式，研發了高效的因果3D VAE、可擴展的預訓練策略等。以3D VAE為例，為了高效支持任意長度視頻的編碼和解碼，萬相在3D VAE的因果卷積模塊中實現了特徵緩存機制，從而代替直接對長視頻端到端的編解碼過程，實現了無限長1080P視頻的高效編解碼。此外，通過將空間降採樣壓縮提前，在不損失性能的情況下進一步減少了29%的推理時內存佔用。\n　　萬相團隊的實驗結果顯示，在運動質量、視覺質量、風格和多目標等14個主要維度和26個子維度測試中，萬相均達到了業界領先表現，並且斬獲5項第一。（文猛）\n\n\n海量資訊、精準解讀，盡在新浪財經APP\n\n責任編輯：何俊熹","kind":"news","is_publish_news":true,"is_publish_highlight":false,"is_publish_live":false,"is_publish_wemedia":null,"editions":null,"column":"","sentiment":"0","news_tag":"","news_rank":0,"symbols":[],"gpt_button":0,"need_auth":false,"code":"91000000","status":"200"}}}