これら の 操作 の 具体 的 な 内容 について は 形式 言語 の 情報 工学 的 定義 を 参照 さ れ たい 。
文字 セット Σ 上 の 正規 言語 の 集合 は 以下 の よう に 再帰 的 に 定義 さ れる 。
有限 の 文字 列 から 構成 さ れる 言語 は 全て 正規 言語 で ある 。
その他 の 典型 的 な 例 として は 、 文字 セット { a , b } を 使っ た 文字 列 の うち 、 偶数 個 の a を 含む 文字 列 の 集まり は 正規 言語 で ある し 、 任意 個数 の a の 後 に 任意 個数 の b が 続く 文字 列 で 構成 さ れる 言語 も 正規 言語 で ある 。
正規 言語 の 補 集合 ( 文字 セット から 生成 さ れる 全 文字 列 を 全体 集合 と する ) も 正規 言語 で ある 。
正規 言語 の 文字 列 を 全て 逆転 さ せ た もの も 正規 言語 で ある 。
個々 の 操作 の 具体 的 意味 について は 形式 言語 の 情報 工学 的 定義 を 参照 さ れ たい 。
自然 言語 処理 ( し ぜん げん ごしょ り 、 natural language processing 、 略称 : NLP ) は 、 人間 が 日常 的 に 使っ て いる 自然 言語 を コンピュータ に 処理 さ せる 一連 の 技術 で あり 、 人工 知能 と 言語 学 の 一 分野 で ある 。
自然 言語 の 理解 を コンピュータ に さ せる こと は 、 自然 言語 理解 と さ れ て いる 。
現在 の ところ 、 日本語 を 処理 する 基礎 技術 として は 以下 の もの が 主 に 研究 さ れ て いる 。
SHRDLU など の 初期 の システム は 世界 を 限定 する こと で 非常 に うまく いっ た ため 、 自然 言語 処理 は 簡単 だ という 行き過ぎ た 楽観 主義 に 陥っ た が 、 より 現実 的 な 世界 で は 曖昧 さ や 複雑 さ が 増大 し 、 楽観 的 な 見方 は なくなっ て いっ た 。
また 、 英語 も 含め て 、 形容詞 と 名詞 の 修飾 関係 の 曖昧 さ も ある 。
統計 的 自然 言語 処理 は 、 確率 論 的 あるいは 統計 学 的 手法 を 使っ て 、 上述 の 困難 さ に 何らかの 解決 策 を 与えよ う と する もの で ある 。
自然 言語 処理 の 応用 技術 として 、 以下 の よう な 技術 が 研究 ・ 実用 化 さ れ て いる 。
「 自然 言語 」 という 語 は 特に 数式 や プログラミング 言語 、 人工 的 に 定義 さ れ た 形式 言語 ・ 人工 言語 に 対比 さ せる 必要 が ある 場合 に こう 呼ば れる ( なお 、 数式 や プログラミング 言語 と は 異なり 、 もっぱら 人間 同士 の コミュニケーション で の 使用 を 目的 と し た 、 振る舞い として は 自然 言語 と 類似 し た 人工 言語 も 存在 する こと に 注意 ) 。
自然 言語 は 形式 言語 ・ 人工 言語 に くらべ て 遥か に 多様 性 に 富ん で おり 、 曖昧 さ も 含み 、 言語 仕様 を 明確 に 定義 する こと は 難しい 。
また 、 近年 で は 、 自然 言語 の 意味 内容 を 計算 機 によって 自動 で 処理 さ せる こと を 目的 と し た 自然 言語 処理 も 盛ん で ある 。
自然 言語 と 同様 、 構文 規則 ( 言語 学 で 言う 統語 論 の 規則 ) と 意味 規則 ( 同じく 意味 論 の 規則 ) で 定義 さ れる 。
また 、 プログラミング へ の 応用 も 想定 し て 設計 さ れ た ロ ジバン の よう に 、 人間 の 言語 と プログラミング 言語 の 中間 に 位置 する もの が ある 。
計算 さ れ ない 言語 ( HTML の よう な マーク アップ 言語 など ) は プログラミング 言語 と は 看做さ れ ない 。