たくさんの例文や単語を覚えるのは大変です。何とかして、覚える単語を圧縮できないでしょうか?
そこで、台湾のテレビ番組の字幕を元に使われる頻出単語ランキングを作成しました。
目次[非表示]
テレビ番組での頻出単語ランキング
単語ランキングの作成手順
技術系ブログではないので簡単に説明をいたします。
手順1.Youtubeから現地番組の字幕付き動画を探す。
手順2.文字起こしから字幕をテキストファイルに取り出す。
手順3.テキストマイニングツールKH-Coderを使用し単語を切り出す。
手順4.抽出語リストより単語の頻出数を確認する。
- 台湾のテレビ番組「康熙来了」(2015年放送)3放送分を使用※2016年放送終了
- 時間は約4時間、総抽出語は約4万語、異なり語数は約7,000語
- 分析にはkh-coderというテキストマイニングツールを使用
ランキング
1位 【副詞】就… 1057回
2位 【動詞】说…866回
3位 【副詞】不…831回
4位 【接続詞】然后…625回
5位 【動詞/助動詞】要…552回
6位 【動詞/方向補語】来…493回
7位 【動詞/助動詞/副詞】会…462回
8位 【形容詞/副詞】好…444回
9位 【副詞】就是…433回
10位 【動詞/方向補語】去…325回
今回調べたテレビ番組で最も使用頻度が高い単語は「就」でした。
最も使用頻度が高い動詞は「说」でした。
接続詞は「然后」がよく使用されていました。
方向補語「来」がよく使用されていました。
調べた結果より考察
どのように使われている(頻出単語と他の単語の組み合わせ)
頻出単語は他のどの単語と組み合わせて使用されているのでしょうか?
上位にランキングされた単語を調べてみます。
1.就の使われ方
「就」の左側によく登場する単語は「然后」と「就」でした。
右側によく登場する単語は「说」「会」「不」「好」そして「就」でした。
また、ランク外となってしまいましたが、
2つの動作が連続して発生していることを表す「一…就…」(…するとすぐ…)、
2つの動作が連続して発生していることを表す「一…就…」(…するとすぐ…)、
因果関係を表す「因为(为了)…就…」(…なので)も比較的多く使用されていました。
然后她一来我就说,你等一下
然后我姊就会说,你言下之意是什么
然后我们两个就好了七年吧
因為他去節目就跟人家玩對親的
然后我姊就会说,你言下之意是什么
然后我们两个就好了七年吧
因為他去節目就跟人家玩對親的
2.然后の使われ方
「然后」の左側によく登場する単語は「去」「来」「对」でした。
后来の前の文が「去」「来」「对」で終わり、次に続くという感じですね。
【然后の使用例1】
因為是他搬過來,然後他這一年還在適應這個地方
他抄著我的手就要走進去,然後我就半推半就一直這樣被他拖進去
對,然後後來突然她就會比如說只是下一首歌
因為是他搬過來,然後他這一年還在適應這個地方
他抄著我的手就要走進去,然後我就半推半就一直這樣被他拖進去
對,然後後來突然她就會比如說只是下一首歌
頭に浮かんだことをパっと話して接続詞「然后」でつないでまた話して…。という話し方をするようですね。一般に接続詞の多い文章は読みにくい、と言われていますが、どの放送回でも出現回数が多いことを考えると、会話文では多用されるのかもしれませんね。
【然后の使用例2】
就那一天我们排除万难,连奶都全部排好了→
然后所有行程都弄好了→
所以我明天一整天,我不需要挤奶这件事情,对我来讲是很兴奋的→
然后我就跟她讲好,然后后来・・・
就那一天我们排除万难,连奶都全部排好了→
然后所有行程都弄好了→
所以我明天一整天,我不需要挤奶这件事情,对我来讲是很兴奋的→
然后我就跟她讲好,然后后来・・・
3.说の使われ方
「说」の左側によく登場する単語は「就」「然后」「想」「会」でした。
右側にはよく登場するのは「好」「不」「妳」でした。
「好」は「说好」という言い方、「不」はそのまま言った言葉として使われていました。
右側にはそのまま文が入ることもあり「妳」など代名詞が入ることも多いですね。
他就想说因为他知道
我说好我就去了
然后我老公说不行
她說妳真的很盧耶
我说好我就去了
然后我老公说不行
她說妳真的很盧耶
最強の例文として活用する(良く使われる単語で字幕を抽出)
こうして確認していくと使用頻度が高い単語同士、同じ文の中で同時に使われていることも多そうですね。そこで、字幕からよく使われる単語を組み合わせた例文を作成してみました。ちょっと無理やりな感じもしますが、使用単語的に効率的な例文ということでご容赦ください。
【例文1】
整个双颊泛红,然后就…低头这样子,他多坏,他还用他的脚在那边,在那边搅来搅去…然后我就说你不要这样,你不要这样,就这样子
整个双颊泛红,然后就…低头这样子,他多坏,他还用他的脚在那边,在那边搅来搅去…然后我就说你不要这样,你不要这样,就这样子
【例文2】
来哭声,就是她们根本还没睡着,可能就不知道怎么样,就哭着这样想要跑过来,然后我就会跟我老公说,这么怕,因为从外面她按一个钮的话,那个门又会打开,可是你锁上的话她们
来哭声,就是她们根本还没睡着,可能就不知道怎么样,就哭着这样想要跑过来,然后我就会跟我老公说,这么怕,因为从外面她按一个钮的话,那个门又会打开,可是你锁上的话她们
【例文3】
在那边啰哩巴嗦,不是我就跟我老公讲,然后我老公就说,不行他一定要第一个。然后我就说就开始吵,可是我马上时间到啦。我就是要推进产房,要开始清理了
在那边啰哩巴嗦,不是我就跟我老公讲,然后我老公就说,不行他一定要第一个。然后我就说就开始吵,可是我马上时间到啦。我就是要推进产房,要开始清理了
まとめ
今回は、中国語のたくさんの例文や単語を覚えるのは大変なので何とかして、覚える単語を圧縮できないか、ということで、台湾のテレビ番組の字幕を元に使われる頻出単語ランキングを作成しました。時間を掛けたわりにはそれほど成果がなかったような気もしますが、「就」「然后」「说」をこれほど頻繁に使用していたのか、と新たな発見もありました。
尚、注意点として「バラエティ色の強い台湾のトーク番組」という特徴があること、ツールの仕様上正しく語数が取れない場合があることはご了解ください。
以上です。拜拜ヾ(•ω•`)o
0 件のコメント:
コメントを投稿