我們這樣說故事:混音篇 – 說故事的人 Podcast

我們這樣說故事:混音篇

作者
趙人儁

台灣台北人,專職影視聲音剪輯與混音,並涉足3D音效製作,畢業於紐約大學音樂科技研究所、政治大學廣播電視學系學士班,現居美國紐約。

前言

混音是平衡的藝術。後期聲音製作涵蓋了三大基本元素:對白(Dialogue)、音樂(Music)與音效(SFX/Sound Effects),如同樂器一樣,混音一方面就是在確立這三要素之間主配角的位置,又或者可以微觀地來看,每一個個別聲音的頻段比重如何調整,也是混音的一項重點。

以下我先列出幾個Podcast混音的首要目標,也會在文章的後續討論我的執行過程如何和這些目標產生關聯。

  • 增加對白的清晰度:在Podcast節目中,最重要的元素就是對白,聽眾必須要聽得清楚主持人和來賓在談什麼,因此平衡音量、還原音色和降噪就會是關鍵的工作。
  • 拿捏對白、音樂與音效的比例:由於對白多數時間都是主角,混音時必須確保音樂和音效不會喧賓奪主,並且讓這三者在過程中適時地互動和補位。
  • 緩和轉場:段落與段落之間常常會透過音樂來轉場,混音的工作之一就是確保這些轉場聽起來自然順暢,不會太突兀。
  • 避免讓觀眾分心或受到干擾:這裡談的干擾是指會讓聽眾被抽離出節目內容或「出戲」的東西,包含像是不連續的空間音(Room Tone)、過多的口水聲、噴麥聲、現場的環境噪音、突然的音量變化等等。
  • 維持音色與音量的一致性:除了每一集節目本身之外,整個系列的節目下來,主持人的音色都應該聽起來是一致的,每集的節目也必須維持在相近的音量基準。
《說故事的人》混音專案的工作介面

混音前置:匯入與整理檔案

《說故事的人》的後期工作模式是由彥豪或伯安先完成剪接後,才由我接手混音。後期剪接與混音的檔案交接,幾乎都是透過AAF或OMF兩種檔案格式來完成。這兩種檔案格式會記錄Audio clips的剪輯位置、淡入淡出和音量等設定,簡單來說便是將剪接專案打包,並在不同的剪接軟體或聲音處理軟體(DAW,Digital Audio Workstation)之間傳遞。這類檔案在交接時,除了需要先和剪接端溝通好匯出設定以符合混音需求之外,偶爾也會因為軟體相容性或其他因素導致檔案轉移不完整等問題,建議取得檔案後盡快匯入聲音處理軟體檢查專案,並預留時間進行狀況排除。

完成檔案匯入後,第一項任務便是將音檔拖移到相對應的音軌上,以方便後續作業。一個混音專案(Session)需要清楚地區分音軌,以我用來做Podcast混音的專案為例,通常會分為:對白(主持人、來賓、備用麥克風)、Room tone、音效(Mono、Stereo)、音樂,這些音軌分別送往對白、音效和音樂的Aux track做集中調整,最後再送到Master track

對白處理

外景一、音檔篩選

處理對白的第一步,我會先將音檔進行一輪篩選,把沒有說話的、不需要的音檔剪掉或靜音,以提高對白的清晰度。訪談節目經常會是兩支以上的麥克風分別收錄主持人和受訪者,但在同一個空間下錄音,勢必會錄到其他人的聲音,也就是所謂的串音(Bleed)。因為聲音傳遞到不同的麥克風會有時間差,這些被不同麥克風錄下來的串音透過同一個喇叭同時播放的時候,聽起來就會有相位(Phasing)的問題。因此,我盡量只會使用收錄對象有在講話或反應的音檔,以此減少串音。

如果是執行良好的遠距錄音,通常就不會有串音的問題,但靜音不需要的音檔也可以避免多餘的動作所發出的噪音。

假如錄音時有使用超過一支的麥克風來收錄同一個說話者,我只會保留其中一個音質較好、較清晰的麥克風音軌來使用,以避免相位問題。通常無線麥克風會用作備用音軌,當主要音軌不堪使用的少數情況下,才會替換成備用音軌,並設法利用EQ讓兩者的音色聽起來夠相近,或是兩者同時搭配使用。

二、檢查剪接

剪接師的注意力比較容易放在內容上,有時可能忽略了聲音上的細節,除了確保每個剪接點都自然順暢、不會被人察覺之外,以下這幾個項目在混音階段也需要多加留意。

· 呼吸聲

呼吸聲的波形比較不明顯,很容易在剪接時從中間被一分為二,這導致我們有時候會聽見明顯的斷裂的呼吸聲,或是連續吸氣兩次等等,這些都是絕對要避免的。另外,某些太重、太長或者太干擾的呼吸聲,可以視情況剪掉,或者在混音時降低音量,但相對來說,呼吸同時也是一個讓講話聽起來自然流暢的要件,不建議剪掉太多,有時適時地運用呼吸聲,也可以讓銜接起來生硬的語句變得比較順暢。

·淡入淡出

所有的音檔都應該要適當地淡入(Fade in)、淡出(Fade out)和交叉淡入淡出(Crossfade),除了可以修飾剪接、過渡不同的音檔之外,更是為了要避免瞬間訊號音量變化所造成的Click。

·冗言贅字

「就是、呃、然後」這些不經意說出來的冗言贅字,或者講話結巴,有時是難以避免的,如果偶爾參雜一些在句子之間,只要聽起來自然倒是沒有關係,但過多的贅字可能讓聽眾感到不耐煩,則可以選擇剪掉,最重要的還是要確保語句聽起來自然。

·停頓

太長的停頓或者沉默也會讓人難耐或者不知所措,盡可能修剪掉這些空白,除非是少數的情況下為了營造感性或者尷尬的片刻。但相對來說,適當地運用短暫的停頓則可以幫助調節節奏。

三、音量

對白字句是否能被聽得清楚,是製作podcast節目最重要的一項標準。如果對白聽起來忽大忽小,聽眾得要一直去調整音量鈕,也有可能乾脆就不聽了,加上收聽Podcast的環境往往相對吵雜,好比像是通勤的路上,因此音量的穩定相當重要。

·Clip Gain 和 Volume Automation

使用的Plug-in:WaveRider by Quiet Art (美金189元)

調整音量有兩種方式,一種是調整Clip gain,一種是調整Automation,又稱Fader Riding。這兩者的差別在於在訊號流(Signal Flow)的順序不同,Clip gain改變的是單一Audio clip在經過Plug-ins之前的音量,音量Automation則是形同有個人在幫你推Fader,調整的是訊號經過Plug-ins之後、送出Output前的音量變化。

調整 Clip Gain

需要注意的是,提高Clip gain的時候要確保訊號在經過Plug-ins之前沒有Clipping/超過0 dB,原則上聲音訊號超過0 dB所造成的破音(Distortion)在音質上是不可逆的,但它極有可能在訊號流的後端因為音量被降低而在Meter上被忽略,因此我們必須確保聲音訊號在每一層的傳遞都維持在0 dB以下。

一般來說我會先大範圍、粗略地把音檔的Clip gain調整到接近輸出的音量,稍微大個1至2 dB預留給後續EQ的空間。接著我會使用由Quiet Art出產的Plug-in WaveRider來調整音量Automation。這個Plug-in會偵測音軌上的音量變化,幫你畫好Automation,讓音量聽起來穩定且自然。這個運算過程是real-time的,也就是說一個小時的內容就需要一個小時來完成,但比起手動調整還是有效率非常多。小地方要留意的是,如果完成Automation後還要微調剪輯的話,要留意剪接點處的音量落差所可能造成的Click。

沒有調整音量Automation,音量落差大(出自《說故事的人》EP8:疫情下的人)
使用WaveRider調整音量Automation(出自《說故事的人》EP8:疫情下的人)
手動粗略調整音量Automation(出自《說故事的人》EP8:疫情下的人)

針對在無法取得Plug-in的情況下,替代方案就是手動調整Automation。但要用手工的方式達到像Plug-in那樣細緻的程度,是不符成本效益的,因此會建議以重點式的繪製為原則,將音軌聽過一遍,針對特別大聲或特別小聲的字句做修正,另外從波形上也可以大範圍地看出哪些句子或段落的音量可能偏大或偏小。一般而言,句子的開端通常會比較大聲,隨著句子的進行越講越小聲,所以,如果心有餘力,也可以特別針對開頭或句尾幾個字做音量上的調整。

上方音軌為使用WaveRider調整的音量Automation,下方為手動調整的音量Automation
·Volume Automation vs. Compression

另一個常見的用來控制動態範圍(Dynamic Range)的工具是Compressor。許多入門的Podcaster可能會仰賴Compressor來控制音量,但兩件事其實並不全然相同。這裡我想簡短談談音量Automation和Compression之間的差異。

首先要釐清的是,Compressor的運作與反應是在毫秒之間的,因此它雖然也能夠控制音量,但更主要是在壓縮Transient。Transient是指一個聲音或一個聲波最早出現的高頻瞬間訊號,也就是一個聲波起始處的瞬間波峰,Transient的振幅高,但它不是聲波的主體,對於感知音量的影響小,反而是能夠左右音色的關鍵。Compressor運作的原理便是透過抑制這些超過一定門檻的Transient來讓波形的Headroom增加,進而縮小動態範圍以幫助提升音量,但相對地,它勢必會造成程度不一的音色的改變(Coloration),壓縮過多則會開始出現破音的效果。

音量Automation則是直接調整音量,不涉及音色的變化。雖然Compressor在音樂製作上是很好的工具,但由於Podcast多以談話為主,應該力求聽起來自然而沒有過多渲染,因此主要的音量控制仍然建議要透過Automation來達成,再搭配Compressor做適度的動態修飾。關於使用Compressor的細節在文章後續會再提到。

只依靠compressor調整音量,可以聽到音色因為過度壓縮而變形(出自《說故事的人》EP8:疫情下的人)
四、EQ

使用的Plug-in:FabFilter Pro-Q 3(美金179元)

透過麥克風錄製下來的人聲,總是和我們面對面所聽到的有所出入,這當中牽涉到了麥克風的頻率響應、房間的共鳴、使用麥克風的方式等多項因素。而EQ在這裡的功能便是試圖還原與校正音色。

幾乎所有的DAW都會有自己內建的EQ,效果也都大同小異。我自己習慣使用的是FabFilter的Pro-Q 3,和其他EQ最大的不同是,它的介面上會即時顯示頻譜(Spectrum),因此你可以「看到」正在播放的音軌的頻率分佈變化,是一個很方便的輔助。

Pro-Q 3的即時動態頻譜

我向來都以使用減法EQ(Subtractive EQ)為主,也就是頻率只減少不增加,除了可以避免Output的音量過載之外,更重要的是,處理對白最主要的任務,是要解決這些過多的、不想要的頻率,讓聲音變得更乾淨,而這就是減法EQ的核心原則。少數時候想要稍微凸顯一個比較寬的範圍,例如讓音色整體亮一點,才會選擇提升頻段。

EQ的時候,每一個人的音軌都要獨立聆聽處理,想像說話的人在你面前說話聽起來會是什麼樣子,透過掃頻率(Notch Sweeping)的方式找尋有問題的、特別響的頻段,找到以後,先下拉到-3 dB左右,再決定是否要補一點回來或者再砍一點,以不超過-6 dB為原則。Pro-Q有頻譜的好處就在於,通常這些有問題的頻率,在頻譜上也會比較突出,不過還是要強調,視覺終究是輔助,還是要以耳朵聽到的作為判斷依據。

通常我會先用一個High Pass Filter(HPF)來清除掉多餘的、人聲不需要的低頻,大約在80 Hz到100 Hz附近。其餘的頻段則因人而異,每個人的音色不同,適合的EQ也不一樣,就算是同一個人,使用不同的麥克風或在不同的空間錄音,也會需要不同的EQ。以范姐為例,范姐的聲線偏尖,尤其透過麥克風錄下來,聽久了容易疲乏,所以EQ上我砍掉很多中高頻,讓聲音可以聽起來比較溫暖。

調整EQ之前(出自《說故事的人》EP2:爸媽把我忘掉了)
調整EQ之後(出自《說故事的人》EP2:爸媽把我忘掉了)

每一個頻段都有一個相對應的聲響,例如過多的400到600 Hz聽起來有一種近似紙箱的共鳴,過多的900到1600 Hz聽起來像是帶有鼻音。但請注意,這種歸納絕對不是標準答案。一來每個人的聲線有別,對於聲音清亮和聲音低沉的人來說,同樣的問題不會剛好存在於同一個頻段,再加上每段錄音的狀況也有差異,好比提升3 kHz到4 kHz,可能增加了這一段錄音的清晰度,卻會讓另一段錄音顯得太尖銳。二來則是語言的侷限性,每個讀者對於這些形容詞的想像不盡相同,同一個形容詞指的也不見得是同一件事。因此,熟悉各個頻段聽覺上的聲響,配合運用掃頻率的方式來找到問題,才是靈活度高且長遠可靠的方式。

相較於訪談的對話,我習慣保留多一點點的低頻給旁白,大約在120 Hz到200 Hz附近,讓它保有厚度、聽起來更有廣播感,但處理時也要注意,鄰近的頻率可能會讓聲音聽起來太混濁。另外,1 kHz到4 kHz也是一個需要謹慎對待的頻段,由於有些人會直接使用手機播放Podcast,透過手機的內建喇叭,這個頻段的問題更容易被放大。

關於Podcast的EQ調整還有另一件很重要的事情是,要盡可能地讓主持人的聲音在同一集節目裡和每一集節目裡聽起來是一致的。基於各種不得已的因素,主持人可能會使用不同的麥克風和錄音設備、在不同的錄音空間和環境下,錄製同一集或不同集的節目內容,音色上的差異可能會相當明顯。因此,透過EQ讓新的音檔的音色能夠符合既有的音檔,維持一致性,是Podcast混音中相當重要的一項任務。在節目錄製階段,使用一致且有良好控制的錄音設備與空間也會有很大的幫助。

EQ Matching之前(出自《說故事的人》EP11:白色恐怖:誰的正義?)
EQ Matching之後(出自《說故事的人》EP11:白色恐怖:誰的正義?)

對於剛開始接觸混音程序的人來說,EQ務必要小心使用,常常我們感覺到的改善是來自於改變本身,是因為聽到自己關注的頻率被清掉了,卻不見得是聲音真的變好了。有時候砍了一個頻率,就聽到另一個頻率也有問題,砍了另一個,又聽到哪裡又怪怪的,最後幾乎把所有的頻段都降了一遍,形同回到原點,這表示你在某個地方調得太過頭,又或是動到某個其實沒有問題的頻率。總而言之,混音最重要的就是要知道自己在聽的是什麼,以及要解決的問題是什麼,對於新手而言,建議保守行事,但也不要保守到連自己都聽不出差異。

五、噪音移除

使用的Plug-in:iZotope RX 8 Advanced(美金1199元)

這個部分的修復工作是屬於比較進階、細微的處理。iZotope RX是一款以Spectrogram的形式,同時展現時間、頻率與強度,透過軟體本身的演算法來進行聲音編輯的軟體。使用這類的噪音移除軟體,最需要注意的就是連帶產生的Artifacts,因此原則仍然是不要過度處理,並且要知道針對什麼問題要使用什麼工具以及如何運用。

iZotope RX 8的Spectrogram
· 口水聲

RX主要有兩種工具可以用來消除口水聲:De-crackle和Mouth De-click,它們用於人聲的效果相當接近,不過De-crackle對於黏稠的口水聲更加有效,而Mouth De-click則更針對清脆、顆粒感的口水聲。通常我會視音檔狀況擇一使用,再一鍵套用到所有的音檔即可。

口水聲移除之前(出自《說故事的人》EP9:逃亡的人)
口水聲移除之後(出自《說故事的人》EP9:逃亡的人)
· Click

和上述兩項工具同屬一個家族的還有De-click,不過De-click的效果會更暴力,一鍵套用的結果往往會將許多不該被消除的聲音也一併去除掉。De-click針對的顆粒感噪音更廣泛,通常我拿它來個別使用在不該出現的雜音上。

· 噴麥

當EQ的HPF無法過濾掉噴麥的噪音時,就是De-plosive派上用場的時候。一樣是針對噪音個別使用,否則De-plosive可能會消除掉某些人聲中的低頻。

· 其他噪音

在沒有受到控制的錄音環境下,很容易會有周遭環境的噪音被錄進節目裡,視節目類型的不同,這些噪音有時無傷大雅,但如果我們希望讓錄音內容盡可能乾淨、無干擾,就需要處理各種隨機的噪音。Spectral Repair就如同Photoshop裡的修復工具一樣,可以用來嘗試消除這些噪音,是我很常用的工具,但仍然不是所有噪音都能被完全清除。

·背景噪音

RX有三樣工具可以用來降噪,分別是Spectral De-noise、Voice De-noise和Dialogue Isolate。前兩者主要是針對穩定、單一的背景噪音進行移除,如Room tone或機器的底噪,Spectral De-noise通常能夠將底噪非常完整地清除,但當遇到比較複雜的噪音或不符合它取樣的Noise profile時,Spectral De-noise也很容易產生明顯的Artifacts。Voice De-noise因為比較不佔CPU,更適合當作Insert使用,用它的Adaptive mode來做即時的降噪,降噪效果不如Spectral De-noise有破壞力,但比較有彈性,這也是我主要所使用的設定。Dialogue Isolate則是透過區分出對白與非對白,可以拿來消除較複雜的、不穩定、有變化的背景噪音,當然也可以用於一般的降噪,不過有時候沒有對白時的噪音會被清除得比有對白時的噪音更乾淨,而導致聲音不連續的問題。

降噪這個步驟要特別小心不要過度處理,反而破壞了原本的音質,尤其是當噪音比較重、比較複雜,或是對白音質本身比較差的時候,更要謹慎使用。

六、Compression

使用的Plug-in:Waves R-Compressor(美金29.99元)或Waves R-Vox(美金29.99元)

延續前面所討論的,Compressor在這裡是做為輔助動態控制的工具,而不希望它有太多的音色上的改變。

我通常會用的是Waves 的R-Vox和R-Compressor(Opto mode)。這兩個對我來說都是比較透明、對音色影響小的Compressor,R-Compressor相對更自然,能控制的參數比較多,而R-Vox的聲音則稍微更往前一點,我通常會用於旁白。Attack Time建議設定在10 ms左右,Release Time在150到180 ms左右,Threshold和Ratio則建議調整到讓音量壓縮值維持在1至3 dB的範圍、最多不超過5 dB,我目前的設定是-18 dB的Threshold以及2:1或3:1的Ratio。這兩個Compressor分別是放在VO aux track和Dialogue aux track 上,也就是說,它們會在EQ和音量Automation之後才動作。

·EQ先於compressor

至於為什麼是EQ先於Compressor,這也是一個經常被討論的問題,雖然沒有對錯,但站在後期製作的角度,EQ先於Compressor通常會是比較好的做法。以處理對白而言,最大的目標是要解決和修正問題,我們先利用EQ來清除不要的頻率,再透過Compressor來幫忙控制動態和輔助音量。如果讓Compressor先於EQ的話,那些惱人的頻段就會先經過Compressor的壓縮和渲染,導致問題被放大,那麼就會變得更不好解決。

七、De-Essing

使用的Plug-in:Waves Renaissance DeEsser(美金29.99元)或Waves DeEsser(美金29.99元)

唇齒音(Sibilance)在聆聽過程中容易使聽眾分心,許多時候聽起來會相當刺耳。De-Esser是Compressor的一種,幫助控制某個頻率以上的唇齒音,以減緩它造成的干擾。一般可以設定在5 kHz或6 kHz以上。

八、定位置中

對白的定位(Panning)一律置中。除非你的節目本身是在玩弄空間或戲劇效果,否則在Podcast的世界裡,絕大多數的情況下,把對白Pan到左右兩邊,不僅沒有幫助,反而更會形成干擾。例如,有些人會在通勤時只戴單邊耳機收聽Podcast,那麼你的雙人訪談聽起來就只會剩下獨角戲;又或者,多數時間只有一個主持人或來賓在說話的時候,聽眾將會感覺到單邊的耳朵不斷地被轟炸。

九、Room Tone

在訪談內容底下加上一軌Mono Room Tone,有助於填補那些因為剪接而不連續的間隙,並且創造一種現場環境的印象。

音效剪輯

如何在Podcast中使用音效,這個問題並沒有標準答案。成功的音效設計可以畫龍點睛,樹立一個節目的風格,但多餘的音效也可能分散聽眾的注意力,讓節目變得惱人。其中一部分和類型很有關係,音效適合用於廣播劇類型或是像《說故事的人》這樣的紀實專題式的Podcast或是廣播劇類型的Podcast,主要是為了讓聽眾在聆聽故事的過程中更加投入,有彷彿身歷其境的體驗,而一般的談話類Podcast則不太適合使用音效。

對我來說,做Podcast音效剪輯的其中一項不同是,聽眾不會得到視覺的線索,這意味著所有聲音的運用都必須要明確,要跳脫為影片配音效的思考模式,去考量什麼聲音是成立的、什麼不是,不要讓聽眾聽了會花一兩秒的時間想說「剛剛那是什麼?」,也不要讓你的Podcast聽起來只是少了影像的YouTube影片。

在用聲音建構一個場景的過程中,可以思考的問題是,聲音需要做到多豐富?什麼段落需要音效,什麼段落可以留白?什麼元素需要被以音效呈現,什麼元素可以留給聽眾想像?希望透過音效營造什麼樣的感受?

《說故事的人》所使用的音效多半還是點綴的作用,我會選擇其中比較重要而且有畫面感的段落來添加音效,透過環境音(Ambience)的使用來營造一個空間或背景,讓聽眾彷彿能夠看見那個場景,一邊聽著主述者描述當時發生的事。若是廣播劇則不同,音效用來搬演事件與動作的比例會大幅提升,環境的建構也會更豐富。

以接下來這個片段為例,這個片段是受訪者王明智在講述童年在鄉下成長的回憶,那段回憶有養父母的呵護和兄弟姐妹的陪伴,是既美好又快樂無憂的,因此雖然他只有提及「三合院的生活」和「被帶到田裡工作」,但我在畫面的營造上加入了小孩奔跑歡笑的聲音,並以蟲鳴鳥叫和雞叫聲為底,來建立這個場景讓觀眾進入。

未加上音效的片段(出自《說故事的人》EP2:爸媽把我忘掉了)
加上音效的片段(出自《說故事的人》EP2:爸媽把我忘掉了)

和上面這個片段作為對照,當王明智描述自己被帶到生父的辦公室時,我希望音效上能呈現出兩件事,一是城市與鄉下的對照,因此聲音的編排上刻意工整而生冷,也選用了電梯這種比較「現代化」的聲音;另外也希望表現出來自鄉下的養父面對整間辦公室「呆呆地站在那裡」的不知所措。

未加上音效的片段(出自《說故事的人》EP2:爸媽把我忘掉了)
加上音效的片段(出自《說故事的人》EP2:爸媽把我忘掉了)

配樂處理

配樂的使用同樣較常見於廣播劇或紀實專題這種敘事類型的Podcast,一般談話性節目則比較少見也不太建議使用(片頭與片尾音樂不在此討論範圍)。和影片不同,由於缺乏視覺的線索與字幕,在Podcast中使用背景音樂更需要注意對白被配樂蓋過或搶去焦點的問題。以下將針對如何將配樂適切地融入Podcast裡分享我的做法。

一、音量Automation

處理Podcast 配樂的重點,在於拿捏音樂和對白之間的音量比例,讓對白能被聽清楚。當對白在行進時,音樂就應該退居背景,對白結束時,音樂才會來到前景。有時在對白與對白之間的空白,或是某些音樂本身值得被聽見的時刻,也可以讓音樂適時地呼吸和起伏。

但一個好的混音,對白與配樂的消長在聽眾耳裡應該要是一體成形的,也就是說,配樂的起伏不應該引起聽眾太大的注意,因此,決定好了起始音量和目標音量之後,如何讓這些轉場在不經意中完成就變得很關鍵。我個人偏好的原則是,避免讓音樂早一步預告對白的開始和結束,也避免赤裸裸的音量變化,利用對白出現轉移了聽眾注意力的時機,再來做比較大幅的音量變化,而為了盡量縮小這個落差,也可以在前後預留1至2 dB的空間做緩衝。至於對白結束的地方,執行概念相似,但你還是不希望音樂在對白完全結束後才開始上升,又或是對白還沒結束就被漸強的音樂給搶去焦點。

粗略的配樂音量控制,預告意味太強(出自《說故事的人》EP3:卡在中間的人)
和對白配合緊密且變化較和緩的配樂音量控制(出自《說故事的人》EP3:卡在中間的人)
上方配樂音軌為粗略的音量Automation,下方音軌為配合緊密且和緩的音量Automation

在拿捏配樂或音效與對白之間的音量比例時,很常會發生在監聽喇叭上聽起來剛好,但在監聽耳機上配樂卻太大聲,或是用耳機聽剛好,在喇叭上卻太小聲的情況。首先,耳機的左、右聲道只會各自獨立送到你的左、右耳,並且完全不受聆聽空間的影響,而喇叭的左右聲道則都會先後送到你的左耳以及右耳,需要經過空間的傳播並綜合房間的反射。基於這些先天上的差異,喇叭和耳機所呈現出的聲音本來就會有一定程度上的不同。那麼,混音時究竟應該聽誰的?我的建議是,要以產品最終會被大眾聆聽的方式作為主要的判斷依據。以電影為例,電影是設計來在電影院播放的作品,因此混音時一定是以喇叭為準。Podcast的聆聽方式很多元,雖然沒有明確的統計,但非常多人會使用耳機收聽,因此在做混音的選擇時,能否接近正確地在耳機上呈現就會是不能忽視的考量。關於使用不同設備評估混音,我在後續的段落會再補充討論。

除了在音量上讓出位置給對白之外,也可以從頻率和Stereo Image上輔助,讓這個位置變得更大一點。這些調整應該是很細微的、也不需要做Automation的,在不要太大影響音樂的聆聽感受下,幫助凸顯對白的小方法。

二、EQ

在1 kHz至2 kHz附近降大約2 dB,把這個頻段讓給對白的辨識度。

三、Stereo image

使用的Plug-in:A1 StereoControl by A1AUDIO(免費)或Waves S1 Stereo Imager(美金29.99元)

寬度增加10至15%左右,在不破壞相位的前提下,把Center讓給對白。

Mastering

使用的Plug-in:Waves WLM Plus Loudness Meter(美金35.99元)

所有的音軌最後都要匯集到一個Master track,才進行輸出,主要目的在於控管各個音軌加總後的音量不會破表,並且確保最後的輸出符合響度(Loudness)標準。響度指的即是人們所感知到的音量大小聲,基於播放環境、播放設備與動態範圍的差異,各種不同媒介(電影、廣播電視、網路串流、唱片)各有不同的響度標準,以確保聽眾獲得良好的聽覺體驗。

Waves WLM Plus Loudness Meter
一、Peak Limiting

Limiter是音量的最後一道防線,它是Compressor的一種,任何超過Threshold的聲音訊號都會被直接壓下來,在提升整體音量的同時確保訊號不會超過Ceiling或產生Clipping的問題。大多數的Loudness meter都有內建Limiter的功能。

二、響度測量(Loudness Metering

Podcast的響度標準,一般來說會建議依照Apple Podcasts的平台規範,如下:

平均響度(Integrated Loudness或Long Term Loudness):-16 LUFS

最高峰值(Max True Peak Level):-1.0 dBTP

確切來說,平均響度落在-16到-18 LUFS之間,都是合理範圍,最終還是要靠自己的耳朵來做判斷。使用Loudness Meter將檔案從頭到尾輸出,就可以得到平均響度的數值。

特別要注意的是,如果節目中只有對白、沒有音樂和音效的情況下,有些人會選擇將混音成品以單聲道(Mono)輸出,那麼你的平均響度則應該以-19 LUFS為目標。簡單來說,這是因為當兩個相同的單聲道訊號疊加在一起的時候,音量會增加3 dB,所以-19 LUFS的單聲道音檔透過雙聲道的系統播放出來,音量才會和-16 LUFS的雙聲道(Stereo)音檔聽起來相近。

如果你曾經有過類似的經驗,在切換不同的Podcast節目或YouTube頻道時得要不斷調整播放音量,就是因為創作者們沒有依循響度標準來輸出成品,而平台也沒有強制做響度標準化(Loudness Normalization)的緣故。去年有網友針對600多個美國的Podcast節目單集進行響度分析(來源),發現儘管有-16 LUFS這個廣泛被接受的指標存在,各個Podcast節目的響度音量卻從-8 LUFS到-24 LUFS都有分佈。不過,這並不表示響度標準可以被忽視,一個節目太大聲或者太小聲,都可能會影響收聽的意願,而實際上,絕大多數節目的響度仍然是落在-16 LUFS附近。

成品檢查

混音初步完成後,成品檢查也是在送交或上傳檔案前很重要的步驟。前面有提到,混音需要考量聽眾如何聆聽成品,因此,除了用不同的監聽設備(喇叭/監聽、不同的喇叭)來交叉比對之外,更應該要使用一般消費者會用的播放設備來檢查,才知道混音完的成品在大眾之間實際上聽起來怎麼樣。

我平常會用AirPods或iPhone內建喇叭來聽混完的成品,確認對白夠不夠清楚、音樂和環境音的比例是否合適等等。許多人會一邊開車一邊聽podcast,因此把你的混音帶到車上放也是很好的選擇,也可以注意行車時的噪音會不會使得某些內容聽不見。

另外一個用來檢查音量比例的方式是,在監聽設備上把監聽音量調小,大約調成原本的一半。這時的比例聽起來應該大致上要和你混音時預想的差不多,如果你發現有什麼東西已經消失到聽不見了,或是某些地方聽起來特別突出,那就表示這些地方需要再調整。

這些在檢查程序中發現的問題,最後再回到監聽設備上修正並最終檢查一遍以後,就可以上傳檔案了。