抗日戰爭結束後,美國在延安的軍事觀察團轉變成軍事協調工作小組,按照美國人的想法是在中國建立一個多黨派民主國家,為了達到這個設想美國駐華大使赫爾利飛赴延安與國民黨代表張治中等一道做政治協商斡旋工作,經過國共雙方的多輪激烈博弈形成了《雙十協定》達成共識要民主政治協商建國的綱領,但是隨後蔣介石政府撕毀《雙十協定》而召開國民黨單方主導建國大會發起內戰。
美國人基於現實而不是自己承諾做出支援蔣介石政府決定,對於重慶國民政府的支援包括但不限於運輸投送國民黨軍隊到日偽佔領區進行接收,同時幫助國民黨進行全領域軍事訓練工作,這裡面就有針對國民黨黨務特務機關軍統和中統專項援助,中美技術合作所就是一個代表性時代產物。
餘則成及李涯一大批青年俊才被國民黨軍統局長戴笠主辦的各地軍統訓練班吸收,他們在軍統青浦班裡學習情報電訊及特勤行動及戰略情報等科目,美國人的特務培訓體系和德國情報課程及蘇聯克格勃技術在軍統教育體系裡融會貫通,可以說軍統相容幷蓄世界最先進特務教育理念。
青浦班學員畢業後,他們班主任吳敬中根據學生優勢特長結合其背景給予不同考評分配建議,戴笠像蔣介石學習為自己學生授予畢業證書和畢業寄語培養他們忠誠度,學習戰略情報科目的李涯成為代號為佛龕戰略潛伏者,他被安排隨同青年學生到延安,順利透過審查後在延安第二保小做了教員,經過長期潛伏他一度接近中共中央核心領導層情報。李涯的歷史原型有軍統王牌特工沈之嶽的影子,沈之嶽成功潛伏延安十年後功成身退。
而餘則成經歷抗戰時期刺殺中統叛徒李海豐事件深刻體驗後國民黨腐敗後垮塌效忠領袖信仰,他從國民黨納粹主義思想教育中走出來開始信仰共產主義。透過組織運作,餘則成重返軍統,此時正值抗戰勝利之際,軍統迫切需要在敵佔區重建體系,其中天津和北京作為華北東北華東核心需要大量人才精英,而負責天津站組建工作的吳敬中自然想起自己的學生們,餘則成被吳敬中借調到天津站任職電訊室主任。
餘則成在軍統天津站電訊室負責收發內部各種電報,他有機會把控軍統在北方數省的軍事情報,當然重大情報和核心內容根據加密級別會有相應保密機制根據授權來分發,例如戰略情報則有吳敬中個人掌控。為了獲取吳敬中信任,餘則成在處理接收日偽時期漢奸賣國賊財政時期為站長保留很多,有錢孝敬拉進了師生感情。但是,吳敬中作為老資格的軍統站長還是非常注重屬下業務能力的,於是餘則成為自己打造了業務精通且有學習力人設。
《遠東情報站》是餘則成案頭必備工具書,這本書在歷史中不存在,故事裡餘則成從這本書裡獲知許多蘇聯克格勃和日本參謀本部情報機關先進的情報黑科技和技術,這其中就有錄音剪輯技術,餘則成用美國中情局的軍用錄音機秘密錄製了自己希望錄製的聲音而後剪輯成對話。李涯在設計餘則成夫婦的事件裡用了中統掮客謝若林提供了錄音證據,以其人之道,還治其人之身,餘則成則錄製李涯與地下黨對話來反將一軍。
這種錄音和剪輯情報技術是否出現在抗戰勝利時期也就是1945年至1949年期間呢?
很顯然,編劇為了劇情的科技感而進行時空穿越,錄音和剪輯技術在美國到1966年才出現,對錄音真偽鑑定也是之後美國貝爾實驗室不斷探索時才日益成熟起來。錄音科技經歷一個漫長程序,圍繞錄音鑑定技術進化而出現幾個重要階段:
(1) 時域特徵:1975年,貝爾實驗室的Rabiner等提出了基於短時能量和過零率的雙門限檢測方法,能夠有效應用於低噪聲環境下的端點檢測,20世紀90年代以來,Taboada,Marzinzik等分別在此基礎上進行了改進;2003年,Yang等[採用分形維來區分語音與噪聲,效能優於短時能量和過零率方法。時域方法具有計算量小,便於實時處理等優點,但對非平穩噪聲效能較差,正確識別率較低。
(2) 變換域特徵:1980年,Kobayashi等從音高升降曲線角度出發,提出了基於頻譜特徵的詞邊界檢測方法;1999年,Vahatalo等[13]採用9個IIR濾波器組,提出了一種基於頻譜和週期檢測的方法,用於GSM語音編碼;2002年,Lin等提出了一種基於最小Mel頻帶引數和增強時頻引數用於估計動態噪聲,正確識別率可達75%,成功應用於VAD檢測;2006年,Evangelopoulos等基於濾波器組,提出了Teager-Kaiser能量運算元應用於VAD檢測。變換域演算法具有計算量較小,能夠部分識別非平穩噪聲,正確識別率一般。
(3) 基於距離和測度方法:1993年,Haigh等提出了一種基於倒譜距離的VAD檢測方法,成功應用於低信噪比環境;2015年,趙新燕等針對強噪聲環境,透過引入倒譜距離乘數和門限增量係數,提出了一種基於自適應倒譜距離的端點檢測方法,在-5 dB噪聲環境下取得了大於80%的正確識別率。基於距離和測度的方法在較低噪聲環境下具有較強的魯棒性、計算量較小、正確識別率較高、便於實時處理、對清音效果一般等特點。
(4) 資訊理論方法:1995年,Mcclellan等[18]將譜熵有效應用於線性激勵預測編碼的端點檢測中,取得了較好效果;2008年,Lorber等基於譜熵,提出了Mel域上兩級維納濾波器用於VAD檢測,並採用了NOISEX-92資料庫進行了驗證;李豔等[20]將子帶譜熵與短時平均幅度結合在一起,取得了較好的魯棒效能。Liu等基於預測增益和預測值提出了一種自適應增量調製結構用於VAD檢測。基於資訊理論的方法具有能有效應用於低噪聲平穩環境、大部分方法計算量較小、正確識別率尚可、對清音效果較差等特點。
(5) 基於神經網路的方法:2000年,Hussain等將多層感知器和自適應線性神經網路應用於VAD檢測,效能優於傳統VAD檢測方法;2002年,Ghisellicrippa等[23]將兩層反饋神經網路結合擬牛頓誤差最小化方法應用於有無聲檢測,誤識率降至3%~5%,取得了比時域和變換域方法更好的效能。基於神經網路的方法具有效能好、能夠有效應用於低噪聲平穩環境、引數選擇合適能有效針對非平穩環境、對清音效果較好、計算量較大、實時性較差等特點。
(6) 統計模型和分類演算法:2000年,Couvreur等提出了一種非引數估計隱馬爾科夫模型(Hidden Markov model, HMM)模型,成功應用於VAD檢測;2003年,Gazor等提出了一種兩態HMM模型用於VAD檢測,該模型假定語音和噪聲分別為Laplacian與Gaussian模型,取得了較好的效能;2018年,Selvakumari等[26]將SVM分類方法引入VAD檢測,該方法結合了Bayes演算法。基於統計模型和分類演算法的方法具有效能好、能夠有效應用於低噪聲平穩環境、模型選擇合適能有效針對非平穩環境、對清音效果較好、計算量較大、實時性較差、不同噪聲環境需要不同模型等[28]特點。
除了以上各類方法外,還有基於混沌的方法、基於譜減的方法等。與說話人識別一樣,錄音裝置識別對有無聲判斷在計算量、實時性方面要求不一定很高,但對非平穩噪聲環境、清音判別、正確識別率等方面具有較高要求。可以根據需要選擇統計模型和分類演算法、基於神經網路的方法和變換域方法等,或者多種方法相結合。
也就是說,餘則成的錄音和編輯技術在當時是不存在的,《潛伏》根據同名小說改編,原著只有1萬多字。姜偉說:“這個字數僅夠一集的容量。”於是他參考查閱了大量資料,用10個月時間將小說改編成40萬字的劇本。原著作者龍一在看完劇本後評價說:“姜偉在劇本中發揮了巨大的創造力,使這個故事真正成為一出好戲。”
姜偉畢業於曲阜師範大學歷史系、北京電影學院導演系碩士,很顯然文科生最擅長的是人物關係設計和故事描述,對於具體技術的展開梳理則只能在帶動劇情的時候進行宏觀概述了。這是中國電影電視劇的一個短板,我們不缺少好故事只是缺少如西方那樣複合型能力的好編劇。
綜合而言,想要打磨出如《偽裝者》《琅琊榜》《慶餘年》等這樣文化精品需要編劇和小說家一起跨學科智慧碰撞原生態創新出符合時代精神和科學理念的故事。