適正引用AIの要件定義(1)
前回不正引用の話をしたときに、AIで見破れたりしたらいいのにね、という話がありました。確かにもし実現できれば大変有益なので、真面目に検討していきたいと思います。
その前に、不正引用という言葉についてなのですが、印象があまりよくないので適正引用や適正引用化などのポジティブな言葉を使っていきたいです。
要件定義とは
要件定義というのは何かというと、システムを作るときに、どのような機能を実装するか、どのような性能を満たすべきかを決めることです。
AIも何がしたいか明確でないと作れません。そもそもAIで作るべきなのか、他の方法で解決すべきなのかも分かりません。
「すべての引用を適正にしてくれ」と頼んでも、適正ってなんだ、すべての引用ってどうやって確認するんだ、って話です。
ディベート風に言えば、今は「すべての引用を適正にしたい」という論題だけあって、付帯分や追加プラン、定義、現状の問題の整理、解決性、インパクトなどなど何もない状態という感じです。
つまり要件定義とは、肯定側立論ですね!
さっそく要件定義
とてもよくまとまっている資料がありました。
2017年の通達です。
http://nade.jp/files/uploads/evidence2017.pdf
ここでは注意すべき例が載っています。ということは、この注意すべき例を避けることができれば、より適正に近づくのではないでしょうか。
1.誰がその主張を行ったのかを取り違えかねない例
2.指示語を示す内容を取り違えかねない例
3.省略によって程度の評価が変わり得る例
4.出典が確認できない例
いい感じで問題点が見えてきましたね。しかしこれではまだ粗い。
何を気を付けたらいいのか一つづつ見ていきましょう。
1.誰がその主張を行ったのかを取り違えかねない例
これの原因を考えていきます。
事例1-A 著者が違う→出典の読み上げ・記載ルール違反
事例1-B 文末まで引用していない
事例1-C 孫引き元の人を読み上げなかった→著者が違う
そもそも著者が違うと何がいけないのかという話なんですが、本人が言っていないことを言ったことにしてしまうわけですから、これはほぼ捏造に近いわけです。
また、この人はこういう経歴でこういう研究を経てこの結論に至った、など資料同士を比較するときに誰が何年に言ったということは非常に重要になります。
2.指示語を示す内容を取り違えかねない例
事例2 中略した部分の中に指示語の中身があった
これは、資料を手に入れた段階で中略済みだと絶対に気づけません。
このための対策として、中略は資料集を作る段階では絶対にしないことをお勧めします。今すでに中略されているなら、試合で使う分だけでも本・雑誌など読み直して入力しなおしましょう。
3.省略によって程度の評価が変わり得る例
事例3 文中中略
文中中略はそれだけで信ぴょう性が低く感じます。そこを読んだらまずい事情でもあるんですか?と思います。その数秒をかけられない程度の資料なら最初から読まなくていいです。
4.出典が確認できない例
事例4 リンク切れ
物議を醸したことはとても記憶にあります。魚拓とかWaybackとかは過去の遺物かもしれませんね。とはいえ、資料集にアクセス日を記載していない学校は多いと思います。書いておけば済む話なので、立論に使う資料、反駁の重要な資料くらいは書いておいたほうがいいです。
まとめると
事例1-A 著者が違う→出典の読み上げ・記載ルール違反
事例1-B 文末まで引用していない
事例1-C 孫引き元の人を読み上げなかった→著者が違う
事例2 中略した部分の中に指示語の中身があった
事例3 文中中略
事例4 リンク切れ
え、こんなんどうやってシステムでチェックするの・・・
リンク切れくらいなら機械的にできそうかな。
事例1、2なんて読み上げられた部分だけでは絶対に気づけない。
文中中略は怪しいからわかるかも。でも後略とかはわからないだろうな。
まだまだ先は長くなりそうです。何かいい方法を思いついたら教えてください。