先日、名古屋大学の大名 力(おおな つとむ)先生をお招きし、「正規表現による英語表現の検索」というテーマで講義を行って頂きました。
講義は、大名先生のご著書『言語研究のための正規表現によるコーパス検索』に基づき、演習形式で進められました(ご著書の内容紹介は、こちら(2012年9月11日ブログ記事)を、書籍情報はこの記事の最後をご覧ください)。
正規表現を用いたコーパス検索を通じて体験したことの一つに、“コーパスとの対話”がありました。それは、おおよそ以下のようなことです。
ある目的に基づいて適切な正規表現を作ったとしても、それはあくまでその正規表現を作った本人の知識に照らして「適切」であっただけで、知らず知らずのうちに必要なデータを見落としてしまっている可能性があります。
このような可能性を防ぐためには、普段から研究対象となる言語に積極的に触れ、知識を蓄えておくことも重要ですが、関連する全ての知識を身につけることには限界があります。そこで、いくつかの段階を設定しながら条件を緩める、という方法をとる必要があります。
そして条件を緩めることにより、思いもよらないデータが見つかる→知識が増える→新たな正規表現を作る、といった流れが出来上がる可能性もあります。
さらには、別の目的に合致したデータを見つけることにも繋がります。
以上のようなコーパスとの対話も、“ユーザー フレンドリー”なツールに慣れ過ぎてしまうと見失ってしまう点の一つであると思いました。
どのようなツールを用いるにしても大前提となるのが、コーパス検索の目的を明確化する、ということです。
目的が異なれば、ある正規表現が適切にも不適切にもなり得るため、その意味で、正規表現には正解がない、ということも大名先生はおっしゃっていました。
といったように、コーパスとその検索ツールに限ったお話ではなく、物事の見方全般に対し当てはまるお話を伺うことができました。
大名先生、どうもありがとうございました。
大名力. 2012. 『言語研究のための正規表現によるコーパス検索』東京:ひつじ書房.
Comments