用于向視頻內(nèi)容添加語(yǔ)音內(nèi)容的方法及實(shí)現(xiàn)該方法的設(shè)備的制作方法

文檔序號(hào)：7914046閱讀：184來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：用于向視頻內(nèi)容添加語(yǔ)音內(nèi)容的方法及實(shí)現(xiàn)該方法的設(shè)備的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及用于向經(jīng)受安全性約束的視頻文件添加新的聲音內(nèi)容的方法及實(shí)現(xiàn)該方法的設(shè)備。
背景技術(shù)：
現(xiàn)今存在多種盜版視聽文件的形式。安裝在影院中的攝像機(jī)使得產(chǎn)生投影文件的違法拷貝成為可能。然后在網(wǎng)絡(luò)或者在銷售的諸如CD或者DVD的介質(zhì)上發(fā)現(xiàn)非法拷貝。這些拷貝引起對(duì)電影產(chǎn)業(yè)的損害以及對(duì)于視聽文件的制作者(producer)的收入的損失。設(shè)想復(fù)雜的技術(shù)用于防止或者檢測(cè)這樣的行為。例如，制作者向要投影的文件的圖像并入對(duì)于人眼不可檢測(cè)但是對(duì)于裝置可感知的標(biāo)記。在再現(xiàn)文件期間視覺呈現(xiàn)該標(biāo)記，由此顯著降級(jí)文件并且很大地限制其價(jià)值。為了避免違法復(fù)制，在開始發(fā)送之前使得文件安全是重要的。一般地，通過將文件以一般3分鐘的短視頻的形式呈現(xiàn)的預(yù)告片來(lái)影響該文件的發(fā)布。如果非法拷貝在官方發(fā)布之前流通并且可以由大量用戶再現(xiàn)該非法拷貝，則這可以限制在文件發(fā)布時(shí)的文件的觀看者的數(shù)量并且顯著降級(jí)其收入。因此在文件發(fā)布之前避免泄露該文件的全部或者部分是重要的。一般地，視頻和音頻軌道(track)在安全車(secure van)中流通(circulate)。過去，在配音期間已經(jīng)發(fā)生一些泄露。當(dāng)視頻和音頻內(nèi)容被完成時(shí)，視頻軌道至少與要以配音語(yǔ)言讀取的文本腳本(script) —起被分派給配音者。這些拷貝是不久將要發(fā)布的文件中的那些，因此即使聲音軌道不與其相關(guān)聯(lián)它們也具有高價(jià)值。因此，使制作者和配音棚之間的視頻軌道發(fā)送安全或者限制該視頻軌道的價(jià)值是重要的。一種手段在于使用安全傳輸，但是如果配音者在講該語(yǔ)言的國(guó)家執(zhí)行配音這證明是昂貴的。

發(fā)明內(nèi)容
本發(fā)明使得能夠?qū)Πl(fā)送到配音棚的文件的價(jià)值進(jìn)行限制。本發(fā)明涉及用于向視聽文件添加新語(yǔ)音內(nèi)容的方法，包括以在再現(xiàn)設(shè)備中接收由圖像組成的視頻文件的步驟；其特征在于，接收的視頻文件的一些圖像具有至少一個(gè)降級(jí)后的區(qū)域和至少一個(gè)未降級(jí)的區(qū)域，方法還包括以下步驟-在視頻文件的再現(xiàn)期間，在計(jì)時(shí)器(timemarker)定義的時(shí)刻獲取至少一個(gè)語(yǔ)音內(nèi)容，所述計(jì)時(shí)器定義其圖像包含在至少一個(gè)未降級(jí)區(qū)域中出現(xiàn)的視覺元素的視頻文件的區(qū)，-向視聽文件的管理者發(fā)送至少一個(gè)新獲取的語(yǔ)音內(nèi)容以及相關(guān)聯(lián)的計(jì)時(shí)器，-以如此的方式集合視聽文件和至少一個(gè)新獲取的聲音內(nèi)容，使得在相關(guān)聯(lián)的計(jì)時(shí)器定義的時(shí)刻再現(xiàn)語(yǔ)音內(nèi)容。以該方式，用以添加新聲音內(nèi)容的發(fā)送的文件不具有很大電影制片價(jià)值(cinematographic value)0根據(jù)第一細(xì)化，向視頻文件再現(xiàn)裝置發(fā)送表示新語(yǔ)音內(nèi)容的講話的文本以及多個(gè)與該文本相關(guān)聯(lián)的計(jì)時(shí)器。在所述計(jì)時(shí)器的幫助下在視頻文件的再現(xiàn)的指示時(shí)刻再現(xiàn)至少一部分所述文本。以該方式，配音者可以在屏幕上讀他必須發(fā)音的文本。根據(jù)第一細(xì)化的細(xì)化，還發(fā)送與該文本相關(guān)聯(lián)的屬性列表并且在所述計(jì)時(shí)器的幫助下在視頻文件的再現(xiàn)的指示時(shí)刻顯示。這些屬性向配音者提供關(guān)于讀文本的方式的指示。根據(jù)第一細(xì)化的另一細(xì)化，在視頻文件的圖像的降級(jí)后的區(qū)域的配音者前面的屏幕的至少一個(gè)圖形窗口中顯示該文本。以該方式，文件的全部未降級(jí)部分優(yōu)選是可讀的并且對(duì)于配音有用。根據(jù)最后細(xì)化的另一細(xì)化，在文件再現(xiàn)級(jí)檢測(cè)視頻文件的圖像的降級(jí)后區(qū)域。以該方式，不需要發(fā)送降級(jí)后區(qū)域的坐標(biāo)。根據(jù)變型，發(fā)送視頻文件的降級(jí)后部分的位置并且由再現(xiàn)裝置使用，以定位在這些降級(jí)后區(qū)域中顯示文本的圖形窗口。以該方式，不需要確定這些區(qū)域并且消耗計(jì)算能力以分析要在屏幕上顯示的圖像。根據(jù)另一細(xì)化，向再現(xiàn)裝置發(fā)送構(gòu)成視聽文件的原始聲音軌道的音頻內(nèi)容，該音頻內(nèi)容還在再現(xiàn)視頻內(nèi)容期間再現(xiàn)。本發(fā)明還涉及一種觀看設(shè)備，包括用于接收從視聽文件眾產(chǎn)生的視頻文件的部件，用于獲取并且記錄語(yǔ)音內(nèi)容的部件，其特征在于，接收的視頻文件的一些圖像具有至少一個(gè)降級(jí)后的區(qū)域以及至少一個(gè)未降級(jí)的區(qū)域，獲取設(shè)備影響在計(jì)時(shí)器定義的時(shí)刻獲取至少一個(gè)語(yǔ)音內(nèi)容，所述計(jì)時(shí)器定義其圖像包含顯示部件在視頻文件的再現(xiàn)期間顯示的視覺元素的視頻文件的區(qū)，視覺元素在至少一個(gè)未降級(jí)區(qū)域中出現(xiàn)，一種用于發(fā)送至少一個(gè)新獲取的語(yǔ)音內(nèi)容和相關(guān)聯(lián)的計(jì)時(shí)器的部件。

通過借助于附圖解釋的本發(fā)明的非限制示例性實(shí)施例的描述，本發(fā)明的其他特性和優(yōu)點(diǎn)將明顯。在附圖中-圖1是音頻和/或視覺內(nèi)容制作裝置的示例性框圖，-圖2表示根據(jù)本發(fā)明的示例性實(shí)施例的配音棚的框圖，-圖3表示根據(jù)本發(fā)明的示例性實(shí)現(xiàn)方式的安全區(qū)域的主環(huán)道(circuit)的示例性布局，-圖4表示在新聲音軌道創(chuàng)建期間在配音棚級(jí)顯示的示例性截圖(screenshot)，-圖5.a表示包含人面部的未降級(jí)原始視頻軌道的示例性圖像，-圖5.b表示包含降級(jí)后的視頻軌道的示例性圖像，-圖6表示包含兩個(gè)人面部的降級(jí)后的原始視頻軌道的示例性圖像。
具體實(shí)施例方式圖1圖示根據(jù)本發(fā)明優(yōu)選示例性實(shí)施例的視聽文件的制作裝置的基本布局。制作裝置1包括中央單元1. 1、包括操作程序的程序存儲(chǔ)器1. 2、包含音頻和/或視覺內(nèi)容的數(shù)據(jù)庫(kù)1. 3以及使其能夠經(jīng)由網(wǎng)絡(luò)1. 5下載并且發(fā)送音頻和/或視覺內(nèi)容的雙向通信接口1.4。網(wǎng)絡(luò)1.5可以是因特網(wǎng)型。程序存儲(chǔ)器1. 2包含基于各種拍攝(shot)(或“剪輯(cut) ”)制作視聽文件的模塊、用于分析存儲(chǔ)在數(shù)據(jù)庫(kù)1. 3中的文件的模塊以及至少一個(gè)意圖降級(jí)一些地方的圖像的模糊模塊。分析模塊依靠可能呈現(xiàn)的屬性，允許更容易地確定一方面存在圖像的一些特性(典型地演員的頭部、他們的面部或者他們的嘴唇)以及另一方面所述特性在圖像中的位置。一般地，分析模塊確定對(duì)于配音有用的圖像的所有區(qū)域，這可以是例如手的移動(dòng)、光、物體的突然出現(xiàn)等。圖2圖示配音棚2. 1的基本布局。配音棚具有鏈接到程序存儲(chǔ)器2. 3的中央單元2. 2 (UC)、允許用戶輸入再現(xiàn)視頻軌道和配音期間所需的所有命令的鍵盤2. 4、允許獲得來(lái)自麥克風(fēng)的信號(hào)并且使得它們被數(shù)字化的音頻輸入接口 2. 5、包括向至少兩個(gè)擴(kuò)音器2. 7分派放大后的聲音信號(hào)的至少一個(gè)放大器的用于音頻信號(hào)的輸出接口 2. 6。鍵盤2. 4具有驗(yàn)證鍵以及旋轉(zhuǎn)元件，使得其能夠在屏幕上移動(dòng)索引，該元件是例如鏈接到鍵盤的鼠標(biāo)。鍵盤具有使得其能夠輸入如選擇屏幕圖標(biāo)可獲得的那些相同的命令的鍵。揚(yáng)聲器2. 7連接到讀取器，它們可以是用戶佩戴的頭戴式耳機(jī)上的聽筒。數(shù)據(jù)存儲(chǔ)器2. 8鏈接到中央單元、典型地是硬盤的該存儲(chǔ)器使其能夠記錄音頻和/或視覺內(nèi)容?？蛇x地，錄音棚2. 1具有可選的可移除音頻和/或視覺數(shù)據(jù)存儲(chǔ)單元2. 9，能夠讀取或者寫入記錄介質(zhì)，諸如音頻CD、DVD、電磁式拾音頭(magnetic cartridge)、電子卡、USB鍵等。錄音棚2. 1還包括用于在遠(yuǎn)程屏幕2. 11上顯示數(shù)據(jù)的電路2. 10。該電路2. 10 (經(jīng)常稱作OSD電路，代表“屏幕上顯示”的縮寫)是文本以及圖形生成器，使得菜單、象形圖或者其他圖形以及菜單能夠有助于配音在屏幕上顯示。中央單元2. 2以及包含在存儲(chǔ)器2. 3中的程序控制OSD電路。可執(zhí)行程序有利地以只讀存儲(chǔ)器2. 3中記錄的程序模塊的形式實(shí)現(xiàn)。還可以以例如ASIC型特定電路的形式實(shí)現(xiàn)。數(shù)字總線1. 5連接到網(wǎng)絡(luò)接口電路2. 12，其以數(shù)字形式或者模擬形式向錄音棚2. 1發(fā)送音頻內(nèi)容，接收器將它們記錄在存儲(chǔ)器2. 8中。音頻和/或視頻內(nèi)容下載是不必在本申請(qǐng)中解釋的熟知技術(shù)。視聽文件的制作在于通過將它們鄰接來(lái)集合拍攝(或者“剪輯”)。圖3圖示包括多個(gè)拍攝的視聽文件。計(jì)時(shí)器標(biāo)記最終文件，文件在計(jì)時(shí)器值0開始。每個(gè)拍攝關(guān)于文件的開始來(lái)標(biāo)記，第一拍攝在計(jì)時(shí)器值TO開始，第二拍攝在計(jì)時(shí)器值Tl開始，第三拍攝在計(jì)時(shí)器值T2開始等。以此方式，當(dāng)拍攝之間導(dǎo)航時(shí)，導(dǎo)航程序使用計(jì)時(shí)器的表來(lái)指向新拍攝。對(duì)于每個(gè)拍攝，一個(gè)或者多個(gè)時(shí)間區(qū)包含要翻譯成另一種語(yǔ)言的講話。由圖3中的水平箭頭表示的這些區(qū)也由計(jì)時(shí)器編索引。以此方式，在文件的再現(xiàn)期間，能夠拍攝之間導(dǎo)航，并且能夠在時(shí)間表上顯示講話區(qū)的位置。由此文件的每個(gè)事件依據(jù)時(shí)間觀點(diǎn)(time standpoint)標(biāo)記。顯著地，當(dāng)講話由演員講出時(shí)，每句的開始和結(jié)束在文件內(nèi)標(biāo)記。由此非常地可能定位需要配音為另一種語(yǔ)言的文件的視頻軌道的部分。每個(gè)部分與開始時(shí)間標(biāo)記和結(jié)束時(shí)間標(biāo)記相關(guān)聯(lián)。在已經(jīng)描述各種元件之后，現(xiàn)在將解釋后面的互操作。圖4圖示視聽文件的制作者、各種配音棚和內(nèi)容管理者之間的各種步驟的進(jìn)程。內(nèi)容管理者可以是文件的制作者，內(nèi)容管理者負(fù)責(zé)提供帶有配音的最終文件。開始，制作裝置具有包括多種序列集合的原始文件并且提取文件的視頻分量。在步驟4. 1，程序模塊分析文件的視頻軌道以確定元素對(duì)于配音(諸如嘴唇的移動(dòng))有用的各種區(qū)域。下面，第二模塊在每個(gè)圖像中降級(jí)不包括這些特性的部分。該降級(jí)在于改變視覺內(nèi)容，然而同時(shí)保存移動(dòng)的顯示和色彩的感知。例如，如果視頻示出在風(fēng)中搖擺運(yùn)動(dòng)的旗子，則觀看者可以認(rèn)識(shí)到這是旗子，但是不能確定哪個(gè)旗子。已知各種視頻降級(jí)技術(shù)，諸如模糊、像素化(pixell ation)或者甚至陰影的疊加?？稍O(shè)想使用不可逆技術(shù)，例如要求遍及文件的處理隨機(jī)改變的數(shù)據(jù)。隨后，制作裝置具有視頻文件，該視頻文件具有相同持續(xù)時(shí)間、相同計(jì)時(shí)器但帶有依據(jù)電影制片觀點(diǎn)具有小價(jià)值的降級(jí)后圖像。該制作裝置與對(duì)應(yīng)要執(zhí)行為各種語(yǔ)言的配音的各種腳本一起發(fā)送降級(jí)后的視頻軌道(步驟4. ?？蛇x擇地，還發(fā)送原始聲音軌道。根據(jù)第一細(xì)化，該聲音軌道是非講話背景噪聲的聲音軌道。以該方式，配音者可以將他的語(yǔ)音與一些噪聲同步。根據(jù)可選擇地與第一可組合的第二細(xì)化，還與講話一起發(fā)送原始聲音軌道。以該方式，配音者可以聽到它以跟隨與視頻軌道中呈現(xiàn)的演員的語(yǔ)調(diào)相同的語(yǔ)音語(yǔ)調(diào)。腳本是在計(jì)時(shí)器的幫助下每個(gè)字或者字的組與視頻文件的某一時(shí)刻相關(guān)聯(lián)的文本。以ASS格式發(fā)送腳本，每個(gè)字符以A. S. C. I. I.編碼。ASS格式的語(yǔ)法使得能夠規(guī)定計(jì)時(shí)器。根據(jù)一個(gè)細(xì)化，以加密方式發(fā)送腳本，借助另一種傳輸部件向配音者給出允許解密的碼。每個(gè)配音棚接收降級(jí)后的視頻文件以及對(duì)應(yīng)其語(yǔ)言的腳本。在步驟4. 3，配音者在面對(duì)他的屏幕的菜單上開始降級(jí)后視頻軌道的再現(xiàn)，在讀的時(shí)刻由計(jì)時(shí)器指示的同時(shí)顯示該腳本。如果接收到加密的腳本，則配音者在開始文件的再現(xiàn)之前必須輸入解密碼。在看配音者正在配音的演員面部出現(xiàn)在屏幕上的圖像并且讀顯示在另一地方的腳本的同時(shí)，該配音者將他的文本發(fā)音到配音棚的麥克風(fēng)。該配音者使用演員嘴唇的移動(dòng)來(lái)實(shí)現(xiàn)與他的文本的更好匹配(步驟4. 4)。允許配音者聽到他本身返回的命令是可用的，以重新開始記錄并且驗(yàn)證他剛剛進(jìn)行的記錄。由此創(chuàng)建新的語(yǔ)音內(nèi)容，該語(yǔ)音內(nèi)容與降級(jí)后的視頻文件的計(jì)時(shí)器相同的計(jì)時(shí)器同步。在步驟4. 5，各種配音棚向內(nèi)容管理者發(fā)送與相關(guān)聯(lián)的計(jì)時(shí)器一起的新的語(yǔ)音內(nèi)容。根據(jù)優(yōu)選實(shí)施例，以加密方式向內(nèi)容管理者發(fā)送語(yǔ)音內(nèi)容以及相關(guān)聯(lián)的計(jì)時(shí)器。同時(shí)，制作裝置(如果其與內(nèi)容管理者不同)向內(nèi)容管理者發(fā)送原始(未降級(jí))視頻軌道(步驟4.6)。在步驟4. 7，內(nèi)容管理者制作最終文件。相應(yīng)地，管理者通過混合配音者的語(yǔ)音內(nèi)容和背景噪聲來(lái)制作與存在的語(yǔ)言一樣多的音頻軌道。在計(jì)時(shí)器規(guī)定的時(shí)刻執(zhí)行配音者發(fā)音的各種聲音序列集合。最終，視聽文件包括視頻軌道和與存在的語(yǔ)言一樣多的聲音軌道。圖5. a和5. b圖示在處理的不同時(shí)刻顯示文件的圖像的截圖。圖5. a表示包含面部的未降級(jí)原始視頻軌道的示例性圖像，諸如其可以在制作裝置1等級(jí)顯示。在發(fā)送到配音棚2. 1之前，該圖像將除顯示面部的區(qū)域之外地被降級(jí)。圖5. b表示配音棚2. 1顯示的示例性菜單。顯示的圖像是在降級(jí)之后的圖5. a中表示的圖像。看到除了單個(gè)個(gè)人面部之外，整個(gè)圖像被模糊。要由配音者讀的腳本出現(xiàn)在圖像底部的滾動(dòng)欄上。圖形指針在文本上移動(dòng)以近似地指示在與顯示的圖像對(duì)應(yīng)的時(shí)刻配音者必須讀的字或字的一部分。通過使用腳本的計(jì)時(shí)器來(lái)移動(dòng)圖形指針，其近似地覆蓋兩秒鐘的講話。圖形指針可以是文本色彩的改變、下劃線、加粗字符等。配音者必須觀察顯示的圖像上演員嘴唇的移動(dòng)，使得嘴唇的移動(dòng)最佳地對(duì)應(yīng)于讀的句子。首先，他必須設(shè)法做到在演員的嘴唇正在移動(dòng)的時(shí)刻講話。這是為什么演員的面部不被降級(jí)并且用良好的分辨率出現(xiàn)在屏幕上是重要的。假設(shè)例如正在配音電影"Quai des brumes，，并且演員 Jean Gabin 正在用法語(yǔ)發(fā)音"t‘ asd' beaux yeux, tusais”。以另一種語(yǔ)言寫出的該句子可以將字轉(zhuǎn)化為“Tu sais que tu as de beaux yeux”。因此，該配音者必須在嘴唇移動(dòng)劃界的時(shí)間內(nèi)發(fā)音該句子，并且在正好相同的時(shí)刻不使原始語(yǔ)言的字匹配配音語(yǔ)言的字。有利地，在屏幕上顯示命令菜單，以允許配音者調(diào)用(recall)可用命令。這些命令是-播放( )-使用原始聲音播放(碌,如果可用)-使用背景噪聲播放( ,如果可用)-返回拍攝的開始(M<)-跳到下一拍攝(剎)-跳到之前拍攝( )-記錄發(fā)音的序列(S)通過在指針的幫助下選擇屏幕上的圖標(biāo)并且通過按壓按鈕可獲得這些命令，它們還通過鍵盤2. 4的鍵可獲得。根據(jù)一個(gè)細(xì)化，向錄音棚發(fā)送降級(jí)后的視頻內(nèi)容以及意圖用于配音者的讀屬性。典型地，這些讀屬性向配音者提供關(guān)于如何讀文本的指示，例如快、慢、單音調(diào)、大喊大叫、囁泣、以尖聲尖氣、以低沉的聲音、結(jié)巴地說(shuō)等等。讀屬性與計(jì)時(shí)器相關(guān)聯(lián)，以在當(dāng)顯示與這些屬性有關(guān)的文本時(shí)的時(shí)刻顯示。這些屬性在菜單的特定窗口中出現(xiàn)。根據(jù)細(xì)化，在圖像降級(jí)的部分顯示各種窗口(腳本、命令菜單、讀屬性、時(shí)間欄等)，以不阻礙面部的可讀性。當(dāng)光標(biāo)的位置位于面部區(qū)域時(shí)隨鼠標(biāo)移動(dòng)的光標(biāo)消失。通過利用降級(jí)類型的知識(shí)來(lái)分析圖像在配音棚級(jí)執(zhí)行圖像降級(jí)后區(qū)域的檢測(cè)。與降級(jí)后的視頻一起發(fā)送作為服務(wù)信息的降級(jí)的性質(zhì)(模糊、劃痕、陰影線、缺乏對(duì)比度等)。根據(jù)一個(gè)變型，制作裝置向降級(jí)后的視頻分派包含演員面部或者嘴唇的區(qū)域的空間坐標(biāo)或者包含演員面部或者嘴唇的區(qū)域。配音棚放置菜單窗口，從而不疊加圖像的任何降級(jí)后的區(qū)域。由此，再現(xiàn)裝置不需要確定降級(jí)后以及未降級(jí)區(qū)域來(lái)定位各種窗口。圖6表示配音棚2. 1顯示的另一示例性菜單。顯示的菜單包括其講話由兩個(gè)配音者配音的兩個(gè)演員。每個(gè)配音者看到除了個(gè)人的兩個(gè)面部之外的模糊圖像。如果配音者一起工作，則通過在同一屏幕上顯示兩個(gè)腳本來(lái)執(zhí)行配音。在該情形中，顯示兩個(gè)腳本欄?？梢允怪甘咀x的時(shí)刻的圖形光標(biāo)置于一個(gè)或者另一個(gè)欄上或者如果配音者必須同時(shí)講話在二者上。本實(shí)施例應(yīng)該通過例示的方式考慮，但是可以在所附權(quán)利要求書的范圍定義的領(lǐng)域內(nèi)作出修改。具體地，本發(fā)明不限于之前描述的解碼器而是任何適合具有安全性約束的環(huán)道的任何裝置。
權(quán)利要求
1.一種用于向視聽文件添加新的語(yǔ)音內(nèi)容的方法，包括步驟2)，在再現(xiàn)設(shè)備(2. 1)中接收由圖像組成的視頻文件；其特征在于，接收的視頻文件的一些圖像具有至少一個(gè)降級(jí)后的區(qū)域和至少一個(gè)未降級(jí)的區(qū)域，所述方法還包括以下步驟-在視頻文件的再現(xiàn)(4. 3)期間，在計(jì)時(shí)器定義的時(shí)刻獲取(4.4)至少一個(gè)語(yǔ)音內(nèi)容，所述計(jì)時(shí)器定義其圖像包含在至少一個(gè)未降級(jí)區(qū)域中出現(xiàn)的視覺元素的視頻文件的區(qū)，-向視聽文件的管理者發(fā)送(4. 5)至少一個(gè)新獲取的語(yǔ)音內(nèi)容以及相關(guān)聯(lián)的計(jì)時(shí)器，-以如此的方式集合(4. 7)視聽文件和至少一個(gè)新獲取的聲音內(nèi)容，使得在相關(guān)聯(lián)的計(jì)時(shí)器定義的時(shí)刻再現(xiàn)語(yǔ)音內(nèi)容。
2.如權(quán)利要求1所述的用于添加新語(yǔ)音內(nèi)容的方法，其特征在于，該方法包括發(fā)送表示新語(yǔ)音內(nèi)容的講話的文本以及多個(gè)與該文本相關(guān)聯(lián)的計(jì)時(shí)器的步驟，以及在再現(xiàn)(4. 3)視頻文件期間在所述計(jì)時(shí)器指示的時(shí)刻由再現(xiàn)裝置(2. 1)顯示至少一部分所述文本的步馬聚ο
3.如權(quán)利要求2所述的用于添加新語(yǔ)音內(nèi)容的方法，其特征在于，該方法包括發(fā)送與發(fā)送的該文本相關(guān)聯(lián)的屬性列表以及與該屬性相關(guān)聯(lián)的多個(gè)計(jì)時(shí)器的步驟，以及在再現(xiàn)(4. 3)視頻內(nèi)容期間在所述計(jì)時(shí)器指示的時(shí)刻由再現(xiàn)裝置(2. 1)顯示所述屬性的步驟。
4.如權(quán)利要求2所述的用于添加新語(yǔ)音內(nèi)容的方法，其特征在于，在視頻文件的圖像的降級(jí)后的區(qū)域中由再現(xiàn)裝置(2. 1)放置的至少一個(gè)圖形窗口中顯示文本。
5.如權(quán)利要求4所述的用于添加新語(yǔ)音內(nèi)容的方法，其特征在于，再現(xiàn)裝置(2.1)利用用于檢測(cè)視頻文件的圖像的降級(jí)后的區(qū)域，從而在其中定位顯示文本的圖形窗口的部件。
6.如權(quán)利要求4所述的用于添加新語(yǔ)音內(nèi)容的方法，其特征在于，該方法包括以下步驟，再現(xiàn)設(shè)備(2. 1)接收視頻文件的降級(jí)后的區(qū)域的位置，從而在其中定位顯示文本的圖形窗口。
7.如權(quán)利要求1至6中任一項(xiàng)所述的用于添加新語(yǔ)音內(nèi)容的方法，其特征在于，該方法包括發(fā)送構(gòu)成視聽文件的原始聲音軌道的音頻內(nèi)容的步驟，以及在再現(xiàn)(4. 3)視頻內(nèi)容期間再現(xiàn)所述音頻內(nèi)容的步驟。
8.一種觀看設(shè)備(2. 1)，包括用于接收從視聽文件中產(chǎn)生的視頻文件的部件(2. 12)，用于獲取并且記錄語(yǔ)音內(nèi)容的部件(2.5，2. 8)，其特征在于，接收的視頻文件的一些圖像具有至少一個(gè)降級(jí)后的區(qū)域以及至少一個(gè)未降級(jí)的區(qū)域，獲取設(shè)備(2. 5)影響在計(jì)時(shí)器定義的時(shí)刻獲取至少一個(gè)語(yǔ)音內(nèi)容，所述計(jì)時(shí)器定義其圖像包含顯示部件(2. 11)在視頻文件的再現(xiàn)(4. 3)期間顯示的視覺元素的視頻文件的區(qū)，視覺元素在至少一個(gè)未降級(jí)區(qū)域中出現(xiàn)，用于發(fā)送至少一個(gè)新獲取的語(yǔ)音內(nèi)容和相關(guān)聯(lián)的計(jì)時(shí)器的部件(2. 12,2. 9)。
9.如權(quán)利要求8所述的觀看設(shè)備(2.1)，其特征在于，接收部件(2. 12)接收包含新的語(yǔ)音內(nèi)容的講話的文本和多個(gè)與所述文本相關(guān)聯(lián)的計(jì)時(shí)器，顯示部件(2. 11)在接收的所述計(jì)時(shí)器指示的時(shí)刻的再現(xiàn)視頻文件期間顯示至少一部分所述本文。
10.如權(quán)利要求9所述的觀看設(shè)備(2.1)，其特征在于，接收部件(2. 12)接收與接收的文本相關(guān)聯(lián)的屬性的列表以及多個(gè)與所述文本相關(guān)聯(lián)的計(jì)時(shí)器，顯示部件(2. 11)在接收的所述計(jì)時(shí)器指示的時(shí)刻的再現(xiàn)視頻文件期間顯示接收的至少一個(gè)屬性。
11.如權(quán)利要求9所述的觀看設(shè)備(2.1)，其特征在于，顯示部件(2. 11)在置于視頻文件的圖像的降級(jí)后的區(qū)域中的至少一個(gè)圖形窗口中顯示文本。
12.如權(quán)利要求11所述的觀看設(shè)備(2.1)，其特征在于，該設(shè)備還包括以下部件，用于檢測(cè)視頻文件的圖像的降級(jí)后的區(qū)域，從而在其中定位顯示文本的圖形窗口。
13.如權(quán)利要求11所述的觀看設(shè)備(2.1)，其特征在于，接收部件0.12)接收在視頻文件的降級(jí)后的區(qū)域的位置，從而在其中定位顯示文本的圖形窗口。
14.如權(quán)利要求8至13中任一項(xiàng)所述的觀看設(shè)備(2.1)，其特征在于，接收部件(2. 12)接收構(gòu)成視聽文件的原始聲音軌道的音頻內(nèi)容，觀看設(shè)備(2. 1)還包括用于在再現(xiàn)(4. 3)視頻文件期間再現(xiàn)所述音頻內(nèi)容的部件。
全文摘要
本發(fā)明涉及一種向視聽文件添加語(yǔ)音內(nèi)容的方法。在用于再現(xiàn)和記錄聲音信號(hào)的設(shè)備中首先接收視頻文件。接收的視頻內(nèi)容包括降級(jí)后的區(qū)域以及優(yōu)選地對(duì)于用戶在再現(xiàn)所述文件期間可視的至少一個(gè)未降級(jí)區(qū)域。所述用戶讀在設(shè)備中記錄的文本。所述用戶在再現(xiàn)接收的視頻內(nèi)容期間的預(yù)定時(shí)刻通過使用在未降級(jí)區(qū)域中出現(xiàn)的視覺元素讀該文本。通過集合視聽文件和至少一個(gè)新創(chuàng)建的聲音內(nèi)容來(lái)生成完全視頻文件。
文檔編號(hào)H04N21/44GK102577413SQ201080046476
公開日2012年7月11日申請(qǐng)日期2010年8月31日優(yōu)先權(quán)日2009年10月15日
發(fā)明者L.奧伊塞爾, L.謝瓦利爾, P.施莫克爾申請(qǐng)人:湯姆森特許公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：L.謝瓦利爾;L.奧伊塞爾;P.施莫克爾
技術(shù)所有人：湯姆森特許公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

hmm用于語(yǔ)音識(shí)別相關(guān)技術(shù)

400電話語(yǔ)音內(nèi)容相關(guān)技術(shù)

午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

用于向視頻內(nèi)容添加語(yǔ)音內(nèi)容的方法及實(shí)現(xiàn)該方法的設(shè)備的制作方法