本站小編為你精心準備了漢語三音節韻律詞時長特征研究參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
《當代外語研究雜志》2016年第5期
摘要:
本文采用基于自然話語語料庫,從實驗語音學角度對漢語普通話自然話語三音節韻律詞的時長分布特征進行了分析研究。研究發現結構性位置因素會對三音節韻律詞的時長產生重要的影響。韻律詞內前字和末字的時長易受到結構性位置因素影響,而中字時長比較穩定;韻律詞內音節時長特征與停延和音高重設關系密切。同時本文發現自然話語中韻律詞音節時長特征與朗讀話語中音節時長特征的不同點。
關鍵詞:
韻律詞,語法組合類型,時長,停延
1.引言
在當今信息社會,語音合成技術發展迅速。在漢語普通話的語音合成過程中,聲學基元是拼接的基本單位,它可能是音節、詞語、語句等。在基元組合的過程中,韻律的變化是非常復雜的,因此韻律對語音合成后的效果影響很大。其中,自然語流中的抑揚頓挫、輕重轉換、節奏分明等特征,主要是通過音高、時長和音強等方面的變化所表現出來的聲學特征。在漢語普通話自然語流中,話語的韻律結構特征會受到多種因素的影響,這些因素包括音高、時長、音強和停延等。
1.1 文獻綜述
1.1.1 英語韻律結構研究
韻律詞這個概念是從西方引進來的,它是從韻律學的角度來規定的“詞”的概念,指“最小的能夠自由運用的語言單位”。關于英語韻律結構層級,Selkirk(1982,1984,1986)提出了很多重要的發現。特別是以英語為例,提出了韻律層級概念,并且論述了音節、音步、韻律詞、音系短語、語調短語和話語等各結構層級的相關性。Nespor和Vogel(1986)受到Selkirk的影響,開拓了韻律音系學研究領域,指出韻律音系學與節律音系學、自主音段音系學相互作用。Hayes(1989)提出了在韻律詞和音系短語之間存在黏附組這一韻律層級單位。McCarthy和Prince(1995)提出韻律形態學,主要研究韻律結構如何影響形態模板的構建和分界。
1.1.2 英語和漢語韻律結構的異同
英語是重音記時節拍語言,漢語是聲調語言。英語的韻律結構層次主要有莫拉(mora)、音節、音步、韻律詞、音系短語、語調短語和話語。綜合王洪君(2008)、李鳳杰(2012)和王麗娟(2015)的主要觀點,可論證漢語同樣存在韻律形態。漢語和英語共同的韻律結構層次是音節、韻律詞、韻律短語、語調短語和話語。莫拉、音步、黏附組是英語中重要的韻律單位,但是在漢語韻律形態中不是凸顯單位,這是因為漢語中無長元音、多輔音叢,所以最好將它們從漢語韻律形態結構中排除。
1.1.3 漢語韻律單位與時長研究
本文關注漢語韻律形態,在韻律形態中的語言單位是韻律單位,韻律詞是以語言中的韻律單位為基礎。言語的韻律組織是一個相當復雜的過程,語句韻律層級就可以看成是這樣一個過程,首先將語句劃分成一定的層次結構。其次是根據語義和表達的需求協調各個層次內結構之間的整體關系,同時在每個層次的內部還需要分配其子單元之間的節奏和輕重快慢。與言語韻律實現相關的主要聲學參數就是每個語音單元的音高和時長。時長是語音的重要聲學特征之一,對語音的可理解度和自然度都有一定的影響。盡管國內外學者從實驗語音學的角度對漢語韻律結構的時長特征已經做了很多卓有成效的研究,但是總體看來先前的研究及其形成的結論還是存在一些值得商榷的地方。主要表現在四個方面:首先,多數實驗設計語料是實驗句,全部實驗詞都放在固定的負載句中,對實際生活中的自然語言的研究不夠深入(林茂燦等1984;馮隆1985;王晶、王理嘉1993;曹文2010)。其次,一些學者(楊玉芳1997;李愛軍1998;曹劍芬1998,2005;王蓓等2004;葉軍2008;鄧丹2010;殷治綱2011)用朗讀語料庫對漢語韻律結構的時長特征進行分析,但是必須承認朗讀語料和自然獨白口語之間存在著很大的結構性差異(劉亞斌、李愛軍2002:18)。此外,一些學者在研究漢語普通話語調結構時只是重視功能性因素對漢語語調的影響,忽視了結構位置因素對連續語流中音節時長的影響。最后,一些學者(王洪君2008;李鳳杰2012;洪爽2015;王麗娟2015)只是從抽象理論建構上探討了漢語韻律結構,并未對自然語流中音節時長特征進行大規模的定量和定性分析,因此,為了能夠從多維度對漢語韻律形態特征進行研究,本文將重點關注結構性位置因素對漢語自然獨白話語韻律結構中音節時長特征的影響。
1.2 研究目標和問題
1.2.1 目標
基于前文分析,本文主要研究漢語普通話自然獨白話語的韻律結構特征與言語結構位置之間的交互性,探討結構性位置因素對漢語普通話自然獨白話語中三音節韻律詞的時長聲學特征的影響。本文所考慮的結構性位置因素主要包括音節自身的聲調類型、韻律詞內相鄰聲調的類型、所在的韻律層級邊界、所在的語調短語位置等。
1.2.2 研究假設
自然獨白話語更加接近人們日常生活口語的表達,包含了豐富的韻律結構信息,有助于我們深入了解實際話語的連讀語流的特點,因此自然獨白話語中韻律詞的時長分布特征應受韻律結構位置因素的影響,且會有某種特點區別于朗讀話語中音節時長分布特征。本文研究的韻律詞不是傳統語法分析中的語法詞,特別是注重從感知和語音的角度來界定漢語普通話自然話語的韻律單元,比如韻律詞。此外,本文關注的是漢語語調的基本模式,即自然焦點條件下的自然話語的陳述語句的語調模式。這是語調模型構建的基礎和語調研究的起點(王萍、石鋒2011)。
2.研究方法
2.1 被試
我們共邀請了四位發音人(兩男兩女),年齡在23~32歲之間,他們通過了普通話水平測試,獲得了普通話水平二級甲等證書,其中一位發音人獲得了普通話水平一級乙等證書。四位發音人均沒有播音專業背景,也沒有受過播音的專業訓練。為了獲得自然話語獨白語料,我們選擇了普通話水平測試的第四項“說話”為測試內容。題目內容涉及學習、體育、朋友和業余愛好等多項與普通人生活密切相關的題型。該語料庫的句子均是陳述句。每位發音人都以自然的方式獨白,沒有特別的強調和感情色彩,語速適中。錄音環境為隔音效果良好的錄音室。每個人的獨白時間大約15~18分鐘。聲音文件采用16KHz采樣,16位數據,單聲道WAV格式存儲。采用praat腳本對所有的韻律詞音節的時長數據進行提取。
2.2 研究設計
本文采用的韻律層級模式基本沿用了目前主流的“音節———韻律詞———韻律短語———語調短語———語句”的層級結構模式。從韻律詞最基本的聲學特征時長入手,運用統計手段對音節的時長值進行了歸整化處理,重點研究結構性位置因素對三音節韻律詞時長的影響,分析其分布特點。
2.2.1 語音學標注介紹
基于已有的研究成果(鄧丹2010;殷治綱2011),本文的語音標注信息主要是以C-ToBI系統為基礎。標注層級為四層:聲韻母層、拼音層、韻律結構間斷指數層和相對重音層。韻律結構間斷指數層標記漢語的韻律結構。間斷指數代表感知到的音節之間以及音節和無聲段之間的音聯程度。話語的韻律結構就是層級組織結構,根據英語和漢語韻律形態的共性,被從小到大依次劃分為音節、音步、韻律詞、韻律短語和語調單位。韻律結構和句法結構不一定一一對應。本研究對韻律層級邊界的間斷指數層進行了如表1所示的界定: 所有語音標注均由五位經過了長時間韻律標注培訓的聽音人完成,她們均具有相關的語音學專業知識,在標注標準和數據一致性等問題上可以得到科學的保證。通過聽覺感知判斷對語料進行了韻律層級結構的標注,例如從語料庫中切分得到了研究需要使用的三音節韻律詞。本研究所使用的全部韻律詞均不含有明顯的強調重音。五位聽音人每人都要獨立完成所有語料的韻律標注。接著在各自完成全部的工作之后,再對五位聽音人的結果進行比較,獲得最終的一致性標注結論,從而確保標注的可靠性和科學性。此外,本研究標注的各類標準基于已有的研究成果,并且已經和相關語音學專家進行多次討論,因此本語料庫使用的標注標準可以反映自然話語獨白語料的真實規律,其可靠性符合研究需要。經過數據統計分析,樣本數據中各類韻律詞的具體數目列舉如下:(1)單音節韻律詞616個;(2)雙音節韻律詞2,371個(不含輕聲的2,080個);(3)三音節韻律詞861個(不含輕聲的456個);(4)四音節韻律詞47個;(5)五音節韻律詞一個。由此可知,樣本數據中的韻律詞共有3,896個,其中兩音節韻律詞比重最多,占比60.86%,其次是三音節韻律詞,占比22.10%,再次是單音節韻律詞,占比15.81%,最后是四音節和五音節的韻律詞,分別占比1.21%和0.26%。兩音節和三音節的韻律詞共有3,232個,占韻律詞總數的82.957%。這就證明了在漢語普通話的自然獨白語流中,發音人的韻律詞內的音節數量分布規律符合王洪君(2008)提出的“二常規、三可容、一四受限”的韻律詞內音節數量規則。
2.2.2 時長數據的測量與分析方法
在數據統計中,為消除不同維度數據之間的差異,一般運用Z-score對樣本數據值進行歸整。即:Z=(x-μ)/σ。但是在語音學研究中,當以音節為統計單元進行時長的歸整時,音節的聲母、韻母、聲調類別都有可能影響音節時長。因此本文以音節為統計單元測量其時長,并采用基于R軟件的混合線性模型預測的方法對時長數據進行歸整,排除不相關的聲母和韻母等固定因素的影響,得出音節的歸整化時長作為數據處理單位。具體處理步驟如下:
(1)首先用已經標注好的各種分類信息(聲母、韻母等)的數據輸入訓練模型,得到預測模型;
(2)將各個語音單元要歸整掉的分類信息作為輸入值,輸入預測模型,預測出參考值;
(3)將語音單元的實際值和參考值相比,求殘差值(以δ表示);
(4)殘差值與標準值的差異即可認為是排除掉輸入的影響類型因素后,其余未考察或未知因素對該單元的影響。這些未考察或者未知因素的影響包括本研究要考察的聲調、音節在所在的語調短語位置、音節所在的韻律層級邊界和語法組合類型等因素,以及其他未知或不能解釋的影響。本研究使用的殘差值(以δ表示)是指實際值與參考值之間的差。我們對殘差值進行了標準化分析,公式為(δ-殘差的均值)/殘差的標準差,得到標準化殘差值(以δ*表示)。δ*遵從標準正態分布N(0,1)。然后將δ*轉換為T數值(余建英、何旭宏2003:87),公式為T=10δ*+50。此外,本文參考已有的研究成果(馮隆1985;曹文2010),對塞音和塞擦音的時長測量方法如下:當塞音或者塞擦音聲母音節處在句首時,該音節的時長的測量不包括所謂的無聲段間隙(gap)。當塞音或者塞擦音聲母音節不在句首,而且聽感上也沒有停頓時,一般以前音節的末尾作為塞音或者塞擦音無聲段的開始,此段間隙計入塞音/塞擦音聲母音節的時長。當這樣的音節不在句首,而且聽感上音節間還有停頓時,這段時長不計入任何音節。
3.三音節韻律詞時長的多因素分析
本文主要對不包括輕聲的三音節韻律詞內音節的歸整化時長進行分析。考察音節本身的聲調類型、所在韻律層級邊界、所在語調短語位置和韻律詞的語法組合類型等結構性位置因素是否對前字、中字和末字音節的歸整化時長產生影響。
3.1 三音節韻律詞的前字歸整化時長
為了消除聲母和韻母等單元對音節時長的影響,我們首先對音節的絕對時長進行了歸整處理。具體方法是用聲母和韻母這些條件做輸入條件,輸入訓練好的基于R軟件的混合線性模型預測參考時長值。公式為Duration~Shengmu+Yunmu。上述公式中沒有輸入聲調類型、音節所在的語調短語位置、韻律層級邊界和語法組合類型,這是因為它們是本文研究焦點,所以要在結果中保留這些參數。然后計算出觀測值與預測值之間的殘差δ。最后我們對殘差值δ進行標準化分析,得出的標準化殘差δ*,可以被認為是排除掉聲母和韻母影響后音節的歸整化時長。接下來對歸整化時長進行多因素方差分析(4x4x3x2)。因變量是前字的歸整化時長,自變量是前字本身的聲調類型(陰平、陽平、上聲和去聲)、所在的韻律層級邊界(韻律詞邊界、韻律短語邊界、語調短語邊界和語句邊界)、所在的語調短語位置(語調短語首、語調短語中和語調短語末)和韻律詞的語法組合類型(1+2類型和2+1類型)。顯著性水平為0.05,置信區間為95.0%。方差分析的結果表明,在α=0.05的水平上,前字音節的自身聲調類型對前字音節歸整化時長值的主效應是顯著的(F(3,456)=3.261,p<0.05);韻律詞的語法組合類型對前字音節歸整化時長值的主效應也是顯著的(F(1,456)=11.473,p<0.01)。音節所在的語調短語位置和韻律層級邊界對前字音節歸整化時長值的主效應不顯著(p值均大于0.05)。另外,影響前字音節歸整化時長的各因素之間交互效應不顯著(p>0.05)。
3.2 三音節韻律詞的中字歸整化時長
然后,對排除掉了聲母和韻母影響的中字的歸整化時長進行多因素方差分析(4x4x3x2)。因變量是中字的歸整化時長,自變量是中字本身的聲調類型、所在的韻律層級邊界、所在的語調短語位置和韻律詞的語法組合類型。顯著性水平為0.05,置信區間為95.0%。方差分析的結果表明,中字音節的自身聲調類型、韻律詞的語法組合類型、音節所在的語調短語位置和韻律層級邊界對中字的歸整化時長值的主效應不顯著(p值均大于0.05)。而且,在α=0.05的水平上,影響中字音節歸整化時長的各因素之間交互效應也不顯著(p>0.05)。
3.3 三音節韻律詞的末字歸整化時長
最后,對排除掉聲母和韻母影響的末字的歸整化時長進行多因素方差分析(4x4x3x2)。因變量是末字的歸整化時長,自變量是末字本身的聲調類型、所在的韻律層級邊界、所在的語調短語位置和韻律詞的語法組合類型。方差分析的結果表明,末字音節的自身聲調類型對末字歸整化時長值的主效應不顯著(F(3,456)=0.598,p=0.617)。但是在ɑ=0.1的水平上,韻律詞的語法組合類型對末字的歸整化時長值的主效應顯著(F(1,456)=3.336,p=0.0691)。在ɑ=0.05的水平上,末字音節所在的語調短語位置對末字的歸整化時長值的主效應顯著(F(3,456)=2.696,p=0.046)。韻律層級邊界對末字的歸整化時長值的主效應顯著(F(3,456)=9.382,p<0.001)。另外,在α=0.05的水平上,影響末字音節歸整化時長的各因素之間的交互效應顯著(p=0.036)。綜合以上的多變量分析結果可知,和鄧丹(2010:108)對朗讀語料韻律詞時長研究發現不同,在普通話獨白類型的自然話語連續語流中,排除聲母和韻母對音節時長的影響后,前字自身的聲調和語法組合類型會對前字的時長有影響。中字時長比較穩定,不會受到其自身的聲調類型、語法組合類型、音節所在的語調短語位置和韻律層級邊界的影響。末字的時長最不穩定,排除掉聲母和韻母對音節時長的影響后,語法組合類型、末字音節所在的語調短語位置和韻律層級邊界都會對末字音節的時長產生影響。此外,根據主效應分析結果,語法組合類型、末字聲調類型、末字音節所在的語調短語位置和末字音節所在的韻律層級邊界———這四個影響末字音節歸整化時長因素之間也會產生交互作用,這表明三音節韻律詞中末字音節的時長最易受到結構性位置因素的影響。
4.討論
4.1 聲調對三音節韻律詞內音節歸整化時長的影響
根據多因素方差分析研究結果可知,韻律詞內音節自身的聲調類型會對音節的時長產生影響。排除掉聲母和韻母對音節時長的影響,取各個音節歸整化時長,為統計方便,先將標準化殘差值線性轉換為T數值,公式為T=10δ*+50;再取各個聲調的線性轉換后的T值的均值;最后對歸整化時長的T值均值(下文簡稱為歸整化時長)進行排列:由表2可知排除掉聲母和韻母對音節時長的影響,前字四個聲調的歸整化時長特征分布特點為:陽平的時長最長,陰平和去聲次之,上聲最短。但對于中字和末字來說,四個聲調歸整化時長分布特點相同。陰平的時長最長,陽平和去聲次之,上聲的時長最短。無論是前字、中字還是后字,上聲的時長都為最短。
4.2 韻律層級邊界對三音節韻律詞內音節歸整化時長的影響
根據多因素方差分析研究結果可知,韻律詞內音節所在的韻律層級邊界會對音節的時長產生影響。
4.2.1 不同韻律層級邊界前的音節歸整化時長的方差分析
排除掉聲母和韻母因素對音節時長的影響,對在韻律詞邊界、韻律短語邊界、語調短語邊界和語句邊界前的前字、中字和末字音節的歸整化時長進行了單向方差分析。根據方差分析的結果可知,在α=0.05的水平上,韻律詞邊界前、韻律短語邊界前、語調短語邊界前和語句邊界前的三音節韻律詞的前字音節(F(3,456)=4.717,p=0.003)、中字音節(F(3,456)=21.392,p<0.001)和末字音節(F(3,456)=80.494,p<0.001)的歸整化時長之間存在顯著差異。
4.2.2 不同韻律層級邊界前音節歸整化時長的分布特點
基于前文方差分析結果可知,三音節韻律詞內音節所處的韻律層級邊界會影響音節歸整化時長。因此本小節關注前字、中字和末字音節歸整化時長的均值在不同韻律層級邊界前的分布特點。韻律層級邊界與停延和音高重設密切相關。在排除掉聲母和韻母對音節時長的影響后,無論是在韻律詞邊界前、韻律短語邊界前、語調短語邊界前和語句邊界前,末字的歸整化時長是最長的、中字次之、前字最短。這表明無論是否在停延前還是在音高重設前,前字的歸整化時長都是最短的,后字的歸整化時長都是最長的。此外,隨著韻律邊界層級的增加,后字的歸整化時長會變長,但是前字和中字的歸整化時長增加的幅度不大。
4.3 語法組合類型對音節的歸整化時長的影響
基于多因素方差分析可知,語法組合類型會影響三音節韻律詞內的音節歸整化時長。因此本節關注不同語法組合類型下韻律詞內音節歸整化時長均值的分布特點。根據圖2可以發現,在排除掉聲母和韻母對音節時長的影響之后,無論是哪種語法類型,前字的歸整化時長是最短的,中字次之,末字的歸整化時長是最長的。1+2類型的三音節韻律詞由一個單音節詞加上一個兩音節詞構成,即前字是單音節詞,中字是兩音節詞的詞首,末字是兩音節詞的詞末。2+1類型的三音節韻律詞是一個兩音節詞加上一個單音節詞構成,即前字是兩音節詞的詞首,中字是兩音節詞的詞末,末字是單音節詞。在1+2類型中,中字時長短于末字,在2+1類型中,前字時長短于中字,因此在底層,處在雙音節詞首位置的音節時長都要短于處在雙音節詞末位置的音節時長,這一點和朗讀話語的研究結果(鄧丹2010:111-112)完全不同。
4.4 語調短語不同位置對音節的歸整化時長的影響
基于多因素方差分析可知,三音節韻律詞內音節所處的語調短語位置會影響音節歸整化時長。因此本節將會關注前字、中字和末字音節歸整化時長的均值在語調短語不同位置的分布特點。排除聲母和韻母對音節時長的影響后,前字、中字和末字的歸整化時長分布特點如下:
(1)在語調短語的首、中、末位置,末字的歸整化時長比前字和中字的歸整化時長都要長。在語調短語首和語調短語末時,前字的歸整化時長最短,中字次之。
(2)在語調短語中時,中字的歸整化時長最短,前字次之。語調短語末后會出現停延,出現在停延前的末字的歸整化時長會變長。
(3)在語調短語末時,末字的歸整化時長明顯比處在語調短語首和語調短語中的末字歸整化時長要長很多。
5.主要結論
通過研究漢語自然語流中三音節韻律詞時長分布情況,發現結構性位置因素會對韻律詞內部時長特征產生顯著影響。具體而言,語法組合類型、韻律詞內音節所在的語調短語位置和韻律層級邊界都會對末字音節的時長產生影響。本文得到的主要發現如下:
(1)三音節韻律詞內前字和末字的時長容易受到結構性位置因素影響,而中字時長比較穩定。具體而言,和朗讀語料的研究發現不同,在自然獨白話語中前字自身的聲調和韻律詞的語法組合類型會對三音節韻律詞的前字時長有影響。末字時長受韻律詞的語法組合類型、所在的語調短語位置和韻律層級邊界的影響。
(2)三音節韻律詞內音節時長特征與停延和音高重設關系密切。前字時長最短,后字時長最長。隨著韻律邊界層級的增加,后字時長會變長,但是前字和中字時長增加的幅度不大。
(3)韻律詞的語法組合類型會對三音節韻律詞內音節時長造成影響。在三音節韻律詞的語法結構底層,處在雙音節詞首位置的音節時長都要小于處在雙音節詞末位置的音節時長,這一點也和朗讀語料的研究發現不同。總之,本研究在一定程度上揭示了漢語自然話語三音節韻律詞內音節時長分布規律,可為研究者進一步了解漢語韻律形態結構提供幫助,具有一定的理論意義和實際意義。
參考文獻:
曹劍芬.1998.漢語普通話語音節奏的初步研究[J/OL].中國社會科學院語言研究所語音研究報告.[2006-10-12].
曹劍芬.2005.音段延長的不同類型及其韻律價值[J].南京師范大學文學院學報(4):160-167.
曹文.2010.漢語焦點重音的韻律實現[M].北京:北京語言文化大學出版社.鄧丹.2010.漢語韻律詞研究[M].北京:北京大學出版社.
馮隆.1985.北京話語流中聲韻調的時長[A].北京語音實驗錄(林燾、王理嘉等編).[C].北京:北京大學出版社,131-195.
洪爽.2015.漢語的最小詞[M].北京:北京語言大學出版社.
李愛軍.1998.普通話韻律短語的時長特性分析[J/OL].中國社會科學院語音研究室語音研究報告.[2006-10-12].
李鳳杰.2012.韻律結構層次:理論與應用[M].天津:天津大學出版社.
林茂燦、顏景助、孫國華.1984.北京話兩字組正常重音的初步實驗[J].方言(1):56-73.
劉亞斌、李愛軍.2002.朗讀語料與自然口語的差異分析[J].中文信息學報(1):13-18,51.
王蓓、呂士楠、楊玉芳.2004.漢語韻律層級邊界結構邊界的聲學分析[J].聲學學報(1):29-36.
王洪君.2008.漢語非線性音系學———漢語的音系格局與單字音[M].北京:北京大學出版社.
王晶、王理嘉.1993.普通話多音節詞音節時長分布模式[J].中國語文(2):112-116.
王麗娟.2015.漢語的韻律形態[M].北京:北京語言大學出版社.
王萍、石鋒.2011.漢語語調的基本模式[J].南開語言學刊(2):1-13.
楊玉芳.1997.句法邊界的韻律學表現[J].聲學學報(5):414-421.
葉軍.2008.現代漢語節奏研究[M].上海:上海世紀出版集團.
殷治綱.2011.漢語普通話朗讀語篇節奏研究[D].中國社會科學院研究生院博士論文.
余建英、何旭宏.2003.數據統計分析與SPSS應用[M].北京:人民郵電出版社.
作者:郭中子 單位:天津外國語大學