現在、内海研究室では、研究生の受け入れを行っていません。
当研究室は電気通信大学大学院情報理工学研究科情報学専攻/情報理工学域I類 経営・社会情報学プログラムに所属しています.内海研究室では「ことば」を基に2つの軸に着目して研究を行なっています.
一つは人は「ことば」をどのように理解しているのかを認知科学的な側面から追求する「言語認知科学」です.特に比喩,皮肉,ユーモアなどに着目した研究が盛んに行われています.
もう一つの軸は「ことば」を機械的に処理することにより,有用な情報を見つけ出す「言語情報科学」です.特に検索結果を自動的に分類しよりユーザが欲しい情報を見つけ出す手助けをしてくれる,クラスタリング.多数の文章のなかから重要なところだけを抽出する重要文抽出が盛んに行われています.
また,本研究室では学生の自主性を尊重しており,さまざまな研究テーマで学生が切磋琢磨しています.
言語認知科学からのアプローチ
自然言語は他のあらゆる言語(動物の用いる言語や人工言語)にはない 文脈依存性(状況に応じて同一の表現が異なる意味を持つという性質)や 非字義性(言外の意味を持つという性質)を有している. そこで,比喩,アイロニー(皮肉),ユーモアなどの非字義的(修辞的) な表現を主な対象として,以下に示すような認知・計算モデルの研究を行っている.
言語認知科学の主要テーマ

「XはYだ(のようだ)」という最も一般的な形式の 比喩表現を対象として,それらの意味を解釈する過程の計算モデルを構築し, 心理実験による人間の解釈結果と比較することにより, 認知モデルとしての妥当性を検証している.
例えば,このモデルで「氷の微笑み」という比喩を解釈すると, たとえる概念である「氷」から容易にイメージできる(典型的な)特徴や属性 を抽出し,たとえられる概念である「微笑み」のどのような側面を強調して いるのかを決定する.この際に「氷」や「微笑み」を単独で考えただけでは 出てこない特徴(例えば,冷淡である,怖い)が比喩によって浮かび上がる という現象をどのように扱うかが比喩理解を考える上で特に重要であり, このような特徴の創発過程の解明を行っている. (興味ある方は,たとえば文献[1]を参照されたい.)
[1] 内海 彰:比喩の認知/計算モデル, Computer Today, 2000年3月号, pp.34-39.

「アイロニー(皮肉)って何?」と聞かれたら,何と答えればよいだろう. おそらくことばで明確に説明するのは困難である. そもそも言語学などの分野でもアイロニーがどのような言語現象かについては 一致した見解はなく,現在でも議論の対象である. そこで,本研究室では,この問いに明確な答えを与える目的で, アイロニーの暗黙的提示理論という枠組みを提案し, 心理実験を通じてその妥当性を確認している.その内容を簡単に言うと,皮肉とは, ある特定の状況(皮肉の話し手は何らかの期待を持っていたが, それが実現しなかったために否定的な感情を抱いている)である ことを,聞き手に間接的に(主に肯定的な表現を用いて)提示する 表現である,ということである. 現在は,この暗黙的提示理論に基づいて, アイロニー解釈の認知・計算モデルを構築している.

なぜ人はある表現を「おもしろい」と思うのであろうか? この問いに答えるために,ユーモア表現のどのような性質が面白さに影響を与える のかを,アンケート等の実験的手法を用いて調べている.

関連性という概念を用いて, 多くの導出可能な含意(ことばに直接表現されていないが伝達される意味,言外の意味) のうちのどれが文脈との関係で適切かを選択する計算モデルを提案し, 比喩やアイロニーの理解モデルに統合することによって,文脈に依存した比喩・アイロニー 理解の計算モデルを構築している.
言語情報処理からのアプローチ
近年のインターネットの爆発的な普及に伴い,ことばによるテキスト情報の効率的な処理 の必要性が急速に高まっている.そこで,テキストの自動要約を中心に言語情報処理の研究を行っている.自動要約については,話のつながり(結束性)を保持した一貫性のある要約を作成する 研究や,テキスト構造を利用した対話記事の要約などを行っている. さらに,さまざまな視点からの要約や,ユーザ特性を考慮した(感性)情報検索, WWWを利用した心理実験システムの構築などに着手し始めている.
言語情報処理の主要テーマ

内容を保持したままで簡潔にまとめる
ー単一テキスト,複数テキストを要約する
ーWeb検索の結果を要約する

情報を複数のグループに分ける
ーWeb検索の結果を話題・ジャンル別に分類する

求める情報・内容を抜き出す
ー情報の提示日時を推測する
ーWebから特定の情報(用語説明)を抜き出す
ー電子メールからイベント情報を抜き出す

情報を選別する
ー電子メールから特定の話題だけを選別する
ーSPAMメールをカットする

テキストの内容を構造化する
ー電子メールや掲示板の情報を構造化して表示する