Book知識とRDF知識空間の接続
📄 SIEにおけるBook知識化では、Book Knowledge Materializationにより、書籍情報をKnowledgeNodeとして構造化する方法を説明しました。しかし、書籍単体の情報だけでは知識空間として十分とは言えません。
実際の知識活用では、書籍は著者、出版社、人物、組織、場所、歴史的背景、関連作品などと結び付いています。
Semantic Integration Engine (SIE) はこれらの知識を単一のデータベースへ統合するのではなく、複数のRDF知識空間を接続し、仮想的な知識グラフとして利用できるようにします。
なぜRDF連携が重要なのか
書籍の価値は、書誌情報だけではなく、その周辺知識との関係によって大きく広がります。
例えば次のような関係があります。
Book
├─ Author
├─ Publisher
├─ Subject
├─ Place
├─ Historical Period
└─ Related Works
『源氏物語』を例にすると、紫式部、平安時代、京都、日本文学、王朝文化といった知識へ自然に接続されます。
このような知識は通常、一つのデータソースに存在するわけではありません。
RDFノード解決
異なる知識空間では同じ人物が異なる識別子で表現されます。
例えば、
Author
├─ OpenBD Author
├─ OpenLibrary Author
├─ Wikidata Entity
├─ VIAF Record
└─ NDL Authority
SIEはこれらを単一のKnowledgeNodeへ対応付けます。
OpenBD Author
↓
KnowledgeNode(Person)
↑
Wikidata Person
↑
VIAF
↑
NDL Authority
これにより知識空間横断で人物知識を統合的に利用できます。
知識の連鎖的拡張
Book知識から様々な知識へ連鎖的に拡張できます。
Book
↓
Author
↓
Organization
↓
Place
↓
Historical Period
↓
Related Works
利用者はBookを起点に知識探索を行えます。
仮想公共知識空間
各RDF知識空間は独立した知識島として運営されています。
OpenBD
OpenLibrary
Wikidata
DBpedia
VIAF
ISNI
NDL
Europeana
SIEはこれらを統合するのではなく接続します。
結果として、利用者から見ると一つの大きな知識空間として利用できるようになります。
これは物理的な統合ではなく、論理的・仮想的な統合です。
アーキテクチャ概要
+------------------+
| KnowledgeNode |
+---------+--------+
|
+------------------+------------------+
| | |
v v v
OpenBD OpenLibrary Wikidata
|
v
VIAF
|
v
ISNI
|
v
NDL
KnowledgeNodeを中心として複数の知識空間が接続されます。
参照
用語集
- RDF
-
W3C により標準化された、情報を「主語–述語–目的語」の三つ組(トリプル)で表現するための知識記述モデル。
- Semantic Integration Engine (SIE)
-
BoK(Body of Knowledge)から生成された構造化知識(RDF)および文書知識(SmartDox)を統合し、AIが直接利用できる形に変換・検索するための統合エンジン。
- 知識グラフ (knowledge graph)
-
現実の概念・事物・出来事をノードとし、その関係をエッジとして表す意味的グラフ構造の知識ベース。