Read/Search this Article
Abstract
りきみ発声は、話者の感情や態度に関連するパラ言語情報の表現において、日常対話に出現する声質である。本研究では、音声およびEGG信号を同時に収録した複数話者の自然対話データベースより、感情表現に関連するりきみ発声が現れる区間を抜き出し、音響特徴および声帯振動様式の分析を行った。EGG信号による声帯振動パターンの分析により、りきみ発声は他の声質(フライやharshなど)に伴って生じる得るが、非りきみ発声に比べて、声帯の総合開放区間と総合閉鎖区間の関係に、話者によらず共通した特徴が存在することが示された。スペクトル分析では、スペクトル傾斜に関連するパラメータは、りきみ区間の一部を識別するのに有効であるが、母音が鼻音化された区間では失敗することが示された。また、言語情報も、パラ言語情報の伝達に関連するりきみ発声の知覚に影響する可能性が示された。
Pressed voice is a voice quality that appears in conversational speech for expressing paralinguistic information related to emotional or attitudinal states of the speaker. We conducted acoustic, electroglottographic (EGG) and paralinguistic analyses on pressed voice segments extracted from spontaneous dialogue speech data. Vocal fold vibratory pattern analyses based on the EGG signals indicate that pressed voices may occur along with several other voice qualities (such as creaky or harsh), but a common feature was found in the relation between overall open and closed intervals, in comparison to non-pressed segments. Spectral analyses show that parameters related with spectral slope are effective to identify part of the pressed segments, but fail when vowels are nasalized. Linguistic contents are also found to influence the perception of pressed voices in the conveyance of paralinguistic information.
Journal
- IEICE technical report. Speech [List of Volumes]
-
IEICE technical report. Speech 109(99), 29-34, 2009-06-17 [Table of Contents]
The Institute of Electronics, Information and Communication Engineers