【 一分鐘行銷快訊】Kling VIDEO 3.0 全新發佈,究竟它又多了什麼強大的功能?
快速摘要
生成式AI素材生成模型「Kling」才剛發佈 O1 模型才沒多久的時間,這次又推出了更進化的 VIDEO 3.0 Omni Model。這次就讓我們一起來看看, VIDEO 3.0 Omni Model 又增強了什麼製作影片的環節吧!
整體升級重點
VIDEO 3.0 Omni 基於新一代「統一多模態大模型」,支援更自然的多模態輸入與輸出(文字、圖片、影片、元素、音訊)。
內建「原生音訊」與「元素一致性控制」,單次可生成最長 15 秒影片,並支援多鏡頭分鏡敘事。
可以同時理解圖片、影片與元素作為提示,角色與物件在不同鏡頭、不同場景中仍能維持高一致性與細節。
新增「帶聲音的元素角色」,可為角色綁定專屬聲線,做到「長得一樣也聽起來一樣」,形成可重複使用的角色資產。
Storyboard Narration 3.0 支援自由時長、多鏡頭自訂,每鏡頭可精準控制構圖、運鏡、台詞與時長。
功能一:All-in-One Reference 3.0
使用者上傳的圖片、影片、元素與文字,全部會被當成「提示」,模型可跨模態理解並結合生成影片細節。
相較 O1,3.0 Omni 在「元素一致性」上大幅提升,角色與物件在不同鏡頭中維持穩定特徵,減少畫面變形與失真。
模型對文字提示的反應更靈敏,畫面更「跟得上腳本」,每次生成的成品更成熟、可直接使用。
功能二:Elements 3.0(角色 + 聲音)
1. 影片角色參考 + 聲音捕捉
上傳或錄製 3–8 秒的角色影片,模型會抽取角色外觀特徵與原始聲音,建立同時具備「視覺 + 聲音」一致性的角色元素。
使用 App 可直接錄自己成為故事主角,模型在各種場景中維持高度相似;若不喜歡原聲,也可上傳乾淨語音覆蓋。
2. 多圖角色元素 + 聲音綁定
延續 O1 的「多角度多圖片角色」功能,在 3.0 Omni 中可額外上傳 3 秒以上的語音,萃取聲線風格,讓原本無聲的角色獲得專屬聲音。
語音綁定後可實現更精準的口型同步與表情驅動,整體視聽體驗更具說服力。
3. 元素建立方式
錄製影片建立角色元素(App):錄影 + 提示導引,完成多角度拍攝與語音錄製,再填寫角色名稱與描述即可建立。
上傳影片建立角色元素:上傳含角色的影片,裁剪至合適長度(建議多角度),再設定聲線與描述完成建立。
多圖角色綁定聲音:上傳正面參考圖後,會出現聲音選項,可上傳影片抽取聲音或選擇既有聲音,之後使用時無需再在提示中重複指定聲音。
功能三:Storyboard Narration 3.0(分鏡敘事)
延續 O1 可自由控制 3–10 秒時長,在 3.0 / 3.0 Omni 中加入「原生自訂多鏡頭」,單次可到 15 秒。
使用者可在腳本中逐鏡頭指定:秒數、景別(遠景/中景/特寫)、角度、台詞、運鏡與銜接方式,實現高精度分鏡控制。
一次生成即可得到節奏完整、結構清晰的多鏡頭影片,減少剪接與重新生成的成本。
與 O1 模型的比較一覽
☕ 品嚐最後一口咖啡,看看我們的總結
總結來說,Kling VIDEO 3.0 Omni 把文字、圖片、影片、元素與音訊真正整合在同一個多模態模型裡,從 All-in-One Reference、角色+聲音的 Elements 3.0,到可精準控秒數與鏡位的 Storyboard Narration 3.0,都大幅提升了元素一致性與腳本跟隨度,讓行銷與內容團隊更容易一次生成可用、分鏡完整、角色視聽統一的短影片成品!未來的行銷素材似乎已經可以預期可以生出海量與質感俱佳的廣告影片了,你是否要快速替自己的品牌找到更多不一樣面向,以因應未來各種創意素材爆棚的時代呢?
如果你也想替你的品牌說一個好故事,或是還不知道如何規劃你的數位行銷策略。甚至你對廣告、社群行銷有任何問題,都歡迎你點擊這顆按鈕來跟我們聊聊
FAQ: Kling VIDEO 3.0 Omni 常見問題
Q1:Kling VIDEO 3.0 Omni 和之前的 O1 模型最大差異是什麼?
A:3.0 Omni 基於新一代統一多模態大模型,強化了元素一致性、多模態理解與分鏡控制,相較 O1 在角色穩定度、畫面細節與腳本跟隨度都有明顯提升。
Q2:VIDEO 3.0 Omni 支援哪些輸入與輸出形式?
A:它支援文字、圖片、影片、元素、音訊等多模態輸入與輸出,並能將這些提示整合為一支完成度高的短影片。
Q3:單次可以生成多長的影片?可以多鏡頭嗎?
A:單次可生成最長約 15 秒影片,並支援多鏡頭分鏡敘事,透過 Storyboard Narration 3.0 可逐鏡頭設定秒數、景別、角度與台詞。
Q4:什麼是 All-in-One Reference 3.0?
A:這功能會把你上傳的圖片、影片、元素與文字全部視為提示,跨模態整合生成影片,同時保持角色與物件在不同鏡頭中的外觀一致與細節穩定。
Q5:Elements 3.0 要怎麼建立有「聲音」的角色?
A:你可以上傳或錄製 3–8 秒角色影片,讓模型同時擷取外觀與原始聲音,或為多圖角色額外上傳 3 秒以上語音,綁定專屬聲線,打造視覺與聲音都一致的角色元素。
Q6:如果我不想用原本錄到的真實聲音,可以怎麼辦?
A:可另行上傳乾淨語音覆蓋原聲,或在建立元素時選擇既有聲音,讓角色維持外觀一致但換成你想要的聲線風格。
Q7:建立角色元素有哪幾種方式?
A:你可以透過 App 錄製多角度影片+語音、上傳含角色的影片裁剪後建立,或用多張角色圖片再綁定額外聲音,之後在提示中就不用反覆指定聲線。
Q8:Storyboard Narration 3.0 可以控制到多細?
A:每個鏡頭都能獨立設定秒數、景別(遠景/中景/特寫)、運鏡、台詞與銜接方式,一次就生成節奏完整、結構清晰的多鏡頭影片,減少後期剪接與重生影片的成本。
Q9:對行銷與內容團隊最大的實際幫助是什麼?
A:每個鏡頭都能獨立設定秒數、景別(遠景/中景/特寫)、運鏡、台詞與銜接方式,一次就生成節奏完整、結構清晰的多鏡頭影片,減少後期剪接與重生影片的成本。
作者 Hugh Chen
喜歡甜食、文字與電影。吟遊詩人是正職,在數位行銷領域兼差超過 10 年。
相信身處在這個擁有豐富網路資源的時代的人都蘊含無限可能。如果有心學習,早餐店阿姨都有可能變成廣告高手亦或油畫大師。
你終究可以成爲你想成爲的。只要持之以恆,時間最終會替你報以掌聲。
• • •