LABB-CAT是一款基于瀏覽器的語言學(xué)研究工具,它可以存儲錄音和正則表達(dá)式的可搜索的訪談文字記錄,搜索結(jié)果、整個筆錄和媒體,可以以各種格式查看或?qū)С觥?/p>

功能介紹
媒體和記錄本的存儲
LaBB-CAT本質(zhì)上是一個音頻/視頻記錄的時間對齊謄本的存儲庫。 可使用Transcriber、Praat或ELAN(可用于創(chuàng)建一個文件,將謄本文本與音頻/視頻記錄中的相應(yīng)位置對齊)制作時間對齊的謄本。然后,謄本被上傳到LaBB-CAT,它允許存儲有關(guān)發(fā)言人和謄本的附加信息。
來自Transcriber、Praat或ELAN的謄本。
征求意見的任務(wù)
您還可以定義誘導(dǎo)任務(wù),包括提示參與者閱讀和問題,讓他們回答。
當(dāng)參與者完成任務(wù)時(使用他們的瀏覽器或移動設(shè)備),他們的語音會被記錄下來并自動直接上傳到LaBB-CAT。
自動注釋
結(jié)合信號數(shù)據(jù)、原始正字轉(zhuǎn)寫本以及一些第三方數(shù)據(jù)和工具,可以對轉(zhuǎn)寫本進(jìn)行自動標(biāo)注,例如。
詞匯標(biāo)簽
來自CELEX的注釋借助CELEX的數(shù)據(jù),可以用更多的數(shù)據(jù)自動注釋單詞。
語音學(xué)
教學(xué)大綱
形態(tài)學(xué)
語氣
頻率
其他詞典也可以整合,包括CMU發(fā)音詞典和Unisyn詞典。
強(qiáng)制對齊
在HTK或WebMAUS的幫助下,在語句層面對齊的抄本可以強(qiáng)制對齊到詞和段層面。
用HTK強(qiáng)制對齊
統(tǒng)計層
LaBB-CAT數(shù)據(jù)庫本身的詞頻數(shù)據(jù)可以直接對每個詞進(jìn)行計算和標(biāo)注。
詞頻層
語言學(xué)探究和字?jǐn)?shù)"(LIWC)可以用來比較語料庫和參考語料庫。
LIWC比較
結(jié)合CELEX的時間排列信息和音節(jié)數(shù),可以計算出不同領(lǐng)域的語音率。
每分鐘的音節(jié)數(shù),行和轉(zhuǎn)彎的音節(jié)數(shù)
斯坦福解析器
在Stanford Parser的幫助下,可以為轉(zhuǎn)錄本生成可編輯的句法樹。
跨越句法成分的注釋。
解析樹表示法
腳本
腳本可以用Python或Javascript編寫,以執(zhí)行arbtrary計算和注釋任務(wù)。
用于計算對偶變異性指數(shù)的Python腳本
IBM Watson人格洞察力
LaBB-CAT可以與IBM Watson的Personality Insights網(wǎng)絡(luò)服務(wù)集成,對抄本進(jìn)行人格分析。
手動注釋
注釋可以手動添加,比如說。
主題標(biāo)簽
針對單個單詞的文本標(biāo)簽
時間點(diǎn)或區(qū)間可以使用Praat進(jìn)行注釋。
使用Praat對點(diǎn)進(jìn)行標(biāo)注
檢索
一旦記錄本和注釋到位,就可以對符合特定標(biāo)準(zhǔn)的記錄本進(jìn)行搜索(例如,基于發(fā)言者的年齡/性別、記錄本所屬的語料庫等)。
按屬性過濾發(fā)言者
當(dāng)發(fā)言者被選中后,可以在不同的層中搜索他們的語句,以尋找文本或常規(guī)表達(dá)。
在 "成人 "話題中搜索 "the",然后在音素層搜索以I、E、i或@開頭的單詞。
這將返回與查詢相匹配的所選抄本中所有語句的列表。
搜索結(jié)果
如果需要,可以將此列表連同相關(guān)的演講者和注釋信息直接導(dǎo)出到csv文件,以便在Excel或R中進(jìn)行進(jìn)一步分析。
搜索結(jié)果
或者可以提取音頻樣本進(jìn)行分析。
從結(jié)果中提取音頻
或者可以直接使用EMU-webApp編輯語句注釋和對齊。
使用EMU-webApp編輯手機(jī)對齊。
如果語句已被強(qiáng)制對齊,可以用Praat對目標(biāo)語段進(jìn)行批量處理。
用Praat進(jìn)行批量處理,以提取形體和其他聲學(xué)措施。
批量Praat處理可以包括您自己的自定義Praat腳本。
自定義Praat腳本,用于搜索結(jié)果的批量處理。
另外,點(diǎn)擊搜索返回的語句,就會產(chǎn)生有關(guān)發(fā)言者的完整文字記錄,與相關(guān)語句一起置于屏幕頂部。可以點(diǎn)擊謄本的任何部分,并播放媒體的相應(yīng)部分。
交互式文字稿
直接從交互式轉(zhuǎn)錄頁面播放媒體,顯示其他注釋層,提取該行的音頻,或在 Praat 中打開包含注釋的相應(yīng) TextGrid。可以添加、編輯或刪除注釋,并調(diào)整對齊方式。