合流点と来れば
合流点と来れば、交絡についても言及しないといけないと思いますが、
- 大データへの読み書き&保全(「JavaScriptが大変 2」参照)
をするプログラムを、オニオンリングとかの形式にして、
- 値作成(ドメインモデルに関連有り)
- 大データへ読み書きする
に分けたとしても、
(下図は、『ジューディア・パール,ダナ・マッケンジー. 因果推論の科学 「なぜ?」の問いにどう答えるか (Japanese Edition)』、「交絡因子 ー 隠された第三の存在」 より)
「保全」が上図Z、「読み書き」が上図X、「値作成」(ドメインモデルに関連有り)が上図Yとなり、
大データの保全の為の値作成(Z→Y)は無くなっていない
というのが典型的な例だと思います。
「読み書き」と言う問題(例えば、RDBの”技術的・技巧的な”所)から目を背けても、大変な部分(保全)の問題は消えないと言う事だと思います。
因果ダイアグラムについての疑問点
上図では、
- Z→Xも、Z→Yも、X→Yも
矢印で書かれていますが、これは因果関係を表しています。
ところで、擬似相関(擬似相関 Wikipedia 日本語版)という言い方も有ります。
- X→Yは、因果関係で無い(相関で有る)
とする言い方です。
本文書でのX→Y(「読み書き」→「値作成」)は嘘の因果関係(p<0.5 ?)とでも言うのでしょうか?
通常、
- 「相関関係は因果関係を含意しない」(擬似相関 Wikipedia 日本語版)
はずですが、逆に
- 「因果関係は相関関係を含意する」
と取れる様に思えてなりません。
この点について何処にも書いて有りませんし、聞ける様な所も知りません。
疑問です。
結論
これからも「smallで無いテストの困難さ」でプログラミングが嫌いになる人は存在し続けることでしょう。