ゼファーネットのロゴ

パフォーマンスの高いデータ サイエンティストのための XNUMX つの考え方

日付:

パフォーマンスの高いデータ サイエンティストのための XNUMX つの考え方

問題について考える方法と、解決策を見つけるために通過する概念的なプロセスは、個人のスキルまたは目前の問題の種類によって導かれる場合があります。 さまざまな思考パターンを表す多くのメンタルモデルが存在します。データサイエンティストとして、さまざまなアプローチを理解することで、ビジネスの世界でデータをより効果的にモデル化し、結果を意思決定者に伝えることができます。


By アナンド・ラオ、最先端の科学、工学、政治、哲学に興味がある.

出典:作者作成。

複雑さは今日の社会に浸透しています。経済、経済内で運営されているビジネス、社会でさまざまな役割を果たしている個人、物理的、社会的、政治的、産業的複合体がどのように相互作用しているかにかかわらず、複雑さを無視することはできません。 . すべての複雑さを捉えた単一または単純な説明はありません。 データ サイエンティストとして、私たちはこの複雑さを理解し、重要なことを分離し、重要でないことを無視して、私たちに提起された重要な質問に答えることを前進させるために、思考を磨く必要があります。

このブログでは、私に提起された抽象的な問題を概念化するのに役立ったいくつかの重要な「思考」パラダイムと、これらの問題に対処して洞察を得る方法について詳しく説明します。 メタ認知または「思考について考える」は議論の対象となる豊富なトピックですが、私は AI の取り組みにとって重要だと考えていますが、ここではデータ サイエンティストに役立つ思考パラダイムに注意を限定します。

モデル思考

データサイエンティストとして、私たちが必要とする最初のそして最も重要なスキルは、 モデル。 最も抽象的な形式では、モデルは、オブジェクト、プロパティ、またはプロセスの物理的、数学的、または論理的な表現です。 重い荷物を持ち上げる航空機エンジンを作りたいとしましょう。 完全な航空機エンジンを構築する前に、ミニチュアモデルを構築して、さまざまな条件下(向かい風、物体との衝撃など)でさまざまな特性(燃料消費量、出力など)についてエンジンをテストする場合があります。 ミニチュアモデルを作成する前でも、さまざまな材料で作成されたミニチュアモデルに何が起こるかを予測できる3Dデジタルモデルを作成する場合があります。

これらの各ケースでは、XNUMXつの異なるエンティティがありました。   と オブジェクト それはモデル化されていました。 最初のケースでは、ミニチュア モデル エンジンは完全な航空機エンジンのモデルでした。 XNUMX番目のケースでは、エンジンのデジタルモデルはミニチュアモデルエンジンのモデルでした。 デジタルモデル自体は、飛行の物理学のさまざまな側面(たとえば、推力)をモデル化する必要がありました。 したがって、モデルは常にオブジェクトである必要はありません。 また、 財産. たとえば、重力のモデルでは、XNUMXつのオブジェクトの相対質量とそれらの質量の中心間の距離が考慮されます。 この特定のケースでは、モデルは方程式または数学的表現です。 ミニチュアモデルエンジンの場合、モデルは物理モデルでした。

モデルはまた約することができます プロセス. たとえば、消費者の購入プロセスのかなり一般的なモデルは、認知、検討、購入、そしてリピート購入から始まります。 ここでのモデルは、段階的なプロセスの論理的表現です。 同じ論理表現を方程式で表すことも、コードとしてプログラムすることもできます。

したがって、モデルは現実の抽象化または研究に値するものです。 それらはまた、私たちが私たちの世界を説明し、理解する方法でもあります。 バークシャー・ハサウェイの副会長であるチャーリー・マンガーは、この考え方の最大の支持者の一人です [1]

「人間の脳がモデルで機能しなければならないことは間違いなく真実だと思います。 秘訣は、あなたの脳が他の人の脳よりもうまく機能するようにすることです。なぜなら、それは最も基本的なモデル、つまりユニットごとにほとんどの仕事をするモデルを理解しているからです。」 「読んでいるものを、実証されている基本的なアイデアの基本構造に関連付けるという精神的な習慣に入ると、徐々にいくつかの知恵が蓄積されます。」

チャーリー・マンガーは、ビジネスの世界でこのタイプのモデル思考の価値を十分に実証してきました。 このスキルは投資にとって重要であるだけでなく、世界を理解するためのより良い方法でもあります。 このタイプのモデル思考は、データサイエンティストやAI研究者にとっても不可欠です。 多くの場合、人間の意思決定のある側面(たとえば、予測、最適化、分類-詳細については[2]を参照)をモデル化するか、プロセスまたは現象(たとえば、異常な動作)を理解する必要があります。 多くの場合、ビジネス、科学 (物理学、化学、生物学)、工学、経済学、社会科学など、さまざまな分野の専門家から、世界を理解し、洞察を引き出し、意思決定を行うためのモデルを構築するよう求められます。または行動します。

データサイエンティストがこれらの分野のメンタルモデルを理解できれば、数式、論理表現、または単なるコードとしてモデル化することが容易になります。 実際、メンタルモデルに関する本は数多くあり [2–4]、文字通り何百ものメンタルモデルが分類されています。 メンタルモデルのサイト [6] には、経済と戦略、人間の性質と判断、システム、生物学的または物理的な世界など、339 の異なるカテゴリの下に 7 のモデルがリストされています。多くのモデル思想家は、より良い決定を下します。 多くのモデルを考える人は優れた意思決定者であるだけでなく、何百ものメンタルモデルに基づいてモデルのアンサンブルを考え、構築できるデータサイエンティストも優れたデータサイエンティストです。 基本的に、モデルのアンサンブルを持つことは、人間にとっても機械にとっても良いことです。

図1:モデル思考とは何ですか? (出典:作者作成)

システム思考

ビジネスとテクノロジーにおける私の XNUMX 年間のキャリアの中で、私が幅広く使用した最も有用で実用的で深遠なメンタルモデルは、 システム思考. それは私が全体像と一見無関係な領域間の相互関係を見るのを助けました。 データサイエンティストにとって、システムの考え方をよく理解し、実践することが重要だと感じています。 Peter Sengeは、システムの考え方を明確に要約しています。

「システム思考は、複雑な状況の根底にある「構造」を確認し、レバレッジの変化が大きいものと小さいものを区別するための分野です。 つまり、全体を見ることで、健康を育む方法を学びます。 そうするために、システム思考は、私たちの考え方を再構築することから始まる言語を提供します。」

システムの考え方を説明する本[10–12]が多数あり、Medium [8,9]には複数のブログシリーズがあります。 私自身の作品では、バリー・リッチモンド [12–13] とジョン・スターマン [11] の作品に最も影響を受けています。 私は彼らの仕事を利用して、それが何であるか、そしてなぜそれがデータサイエンティストに関連するのかを説明します。

私たちの伝統的な教育カリキュラムは、分析的思考、つまり問題を取り上げ、それを構成要素に分解し、これらの部分の解決策を開発し、それらを組み立てる能力を強調しています。 コンサルタントとして、あなたは常に MECE (相互に排他的であり、包括的である) の考え方を持ち、明確に仮説を立て、問題に対処するための MECE の一連のオプションを開発することが求められます。 分析的思考とMECE思考は問題を理解する上で特定の役割を果たしますが、私たちはしばしばそれによって盲目になり、それを疑うことはめったにありません。 一方、システム思考は、MECE 思考に対する完全な対抗手段です。 システム アプローチに伴ういくつかの重要な思考パターンを確認してみましょう。

ダイナミックシンキング — 時間の経過とともに問題がどのように進展するかという観点から、問題の枠組みを強化する思考パターン。 静的思考は特定の出来事に焦点を当てますが、動的思考は物理的または人間のシステムの動作が時間とともにどのように変化するかに焦点を当てます。 入力が時間の経過とともにどのように変化し、それが出力の動作にどのような影響を与えるかを熟考する能力が重要です。

データ サイエンティストは、予測や推論を行うために、ある時点でクロスセクション データの問題にアプローチすることがよくあります。 残念ながら、ほとんどの問題を取り巻く状況は絶えず変化しているため、静的に分析できるものはほとんどありません。 静的な思考は、せいぜい誤解を招き、最悪の場合は悲惨なモデル構築への「XNUMX回限りの」アプローチを強化します。 履歴データでトレーニングされたシンプルなレコメンデーション エンジンやチャットボットでさえ、定期的に更新する必要があります。 堅牢なデータ サイエンス モデルを構築するには、変化の動的な性質を理解することが不可欠です。

システム・アズ・コーズの考え方 —システムの境界内に何を含めるか(つまり、広範な境界)と、含めるものの粒度のレベル(つまり、集中的な境界)を決定する思考パターン。 広範で集中的な境界は、システムを分析しているコンテキストと、意思決定者の管理下にあるものと、意思決定者の管理外にあるものによって異なります。

データサイエンティストは通常​​、提供されたデータを処理します。 これは良い出発点ですが、モデルがどのように使用されるか、および意思決定者が制御または影響を与えることができるものについてのより広いコンテキストを理解する必要もあります。 たとえば、ロボアドバイスツールを構築する場合、マクロ経済指標、資産クラスのパフォーマンス、企業の投資戦略、個人のリスク食欲、個人のライフステージ、投資家の健康状態など、さまざまな側面を含めることができます。含まれる要素の広さと深さは、個人の消費者、アドバイザー、資産管理クライアント、または政府の政策立案者のためのツールを構築しているかどうかによって異なります。 さまざまな要因の全体像と、それらがユーザーやユーザーのコンテキストとともに互いにどのように影響するかを把握することは、ターゲット モデルを構築し、それらを適切に範囲指定するのに役立ちます。

森の考え方 —本質的な詳細を失うことなく、「全体像」を確認し、必要に応じて集約できる思考パターン。 データ サイエンティストは、データの個々の要素 (たとえば、個々の顧客データ) を見て、ツリーごとの考え方を強いられることが多く、提起されている問題を解決するために必要なデータの全体像を理解できません。 これが、「問題を解決するために収集する必要のあるデータ」を調査するのではなく、「利用可能なデータを使用して構築できる最良のモデルを構築する」に変換されることをよく目にします。

運用的思考 —動作がシステムでどのように現れるかについての運用プロセスまたは「因果関係」に焦点を当てた思考パターン。 運用的思考の反対は、先に述べた要因思考、リストベース思考、またはMECE思考です。 データ サイエンスの主要な、または唯一の方法として機械学習に依存すると、プロセスや因果関係を考慮せずに出力変数を予測することに焦点が当てられるという考え方に私たち全員が容易に導かれる可能性があります。 これは多くのアプリケーションに適している可能性がありますが、普遍的に適用できるわけではありません。 説明可能な AI に関する最近の研究は、答えがどのように得られるかについてのプロセスと理論的根拠の一部を再現しようとする試みです。

閉ループ思考 —特定の影響が原因となるシステムのフィードバックループを特定しようとする思考パターン。 単一の前進方向に移動する支配的な「矢としての時間」は、ビジネスおよび科学的努力における私たちの思考を制約してきた強力な考え方です。 データサイエンティストは、この傾向の影響を受けていません。 システム ダイナミクスのコミュニティで広く使用されている因果ループ図とストック フロー図、および因果推論は、データ サイエンティストが直線的な考え方から脱却するために利用できるツールの一部です。

これらは、システム思考の主要なパターンのほんの一部です。 バリー・リッチモンド[12,13]も 量的思考科学的思考非線形思考10,000メートルの思考. さらに、彼は勉強する価値のあるコミュニケーションと学習の原則を共有しています。

システム思考のアプローチは、いくつかの重要な理由から特に魅力的だと思います。 第一に、それは別の考え方を提供し、さらに重要なことに、異種の部分間のつながりを引き出し、多くの場合、問題解決に独自の視点をもたらす考え方を提供します。 第二に、それはよりオープンエンドであり、独自の正しい答えを主張するのではなく、分析する複数の視点とトレードオフを提供します。 これは、多くの場合、脆弱で説明のつかない機械による決定ではなく、より多くの情報に基づいた人間の決定につながります。 第三に、決定を説明し、伝達するためのより良い方法を提供します。 以降の記事では、これらの利点を説明する具体的な例を取り上げます。

図2:システム思考とは何ですか? (出典:著者作成)

エージェントベースの考え方

インターネットでエージェントベースの考え方を検索すると、あまり見つからない場合があります。 代わりに、いくつかの参照が表示されます。 エージェントベースモデリング (ABM)。 ABMは、この種の考え方を具体的に実現したものであり、今後の記事で検討しますが、このようなエージェントベースモデルの構築に先立つ考え方に焦点を当てたいと思います。

エージェントベースの考え方 —より単純な(またはアトミックな)エンティティまたは概念に焦点を当て、これらのエンティティ間の比較的単純な相互作用がどのように緊急のシステム動作をもたらすかについての考え方のパターン。 システム思考と同様に、システムレベルの動作に関心がありますが、トップダウンの観点から関係を観察するのではなく、ボトムアップの観点からシステムの動作を分析します。 思考は個人中心です — 個人の状態 (物理的または精神的) は何か、個人は環境や他の個人とどのように相互作用し、それがその状態をどのように変化させるか。 このような個人中心またはエージェントベースの考え方は、物理的資産(たとえば、サーモスタットはエージェントと見なすことができます)、個人消費者(たとえば、マーケティングコンテキストで購入決定を行う個人消費者のモデル化)、企業エンティティ(たとえば、企業)に適用できます。市場を効率的にするために自分の利益のために行動すること)、あるいは国家政府 (例えば、比較優位に基づいて相互に取引している国々) でさえあります。

システム思考とエージェントベース思考は、同じ一連の問題に適用でき、同様の結果を生み出しますが、異なる考え方やメンタルモデルからアプローチします。 たとえば、病気の進行に関するよく知られた疫学モデル— SEIR(感受性、曝露、感染、回復)は、システムの観点または個人の観点から分析できます。 感受性や曝露などの集団全体を見るときは、システムレベルで作業しており、各個人の状態を調べて、すでに感染しているのか、病気から回復しているのかなどを調べれば、運用しています。エージェントベースのレベルで。

病気の進行の集合的な行動から個々の行動に移行したい場合、エージェントベースの思考はより自然な考え方になります。 たとえば、感染症の全体的なレベルだけでなく、特定の個人の病気や行動(社会的距離やマスクの着用など)に影響を受けやすい個人と、それらが病気の進行にどのように寄与するかを理解したい場合、エージェントベースの考え方はより自然なアプローチです。

エージェント ベースの考え方は、エージェント ベースのモデリング (エージェント ベースのシミュレーションまたはマイクロシミュレーション システムとも呼ばれる)、マルチエージェント システム、および強化学習の基礎です。 その結果、データサイエンティストは、個々のエージェントの観点から問題を分析することに慣れている必要があります。個々のエージェントは、IoTデバイスや物理資産(より一般的には「デジタルツイン」と呼ばれます)、または次のような個々の意思決定エンティティです。消費者、企業など

エージェントベースの考え方は、特定の種類の状況下で特に魅力的だと思います。 まず、エンティティまたはエージェントのコレクションが識別可能で異種である場合、それらの動作を研究する直感的な方法が提供されます。 第二に、エンティティ間の相互作用がよりローカライズされている場合、エージェントベースの思考でそれらを研究する方が簡単です。 第三に、個人の行動(または個人のグループの行動)がシステムの行動よりも重要である場合、エージェントベースの思考はより良いアプローチを提供します。 第XNUMXに、個々のエンティティの適応と変化が異なる場合、システムレベルではなく、個人でモデル化する方が適切です。

図 3: エージェントベースの考え方とは? (出典:筆者作成)

行動(経済学)思考

行動経済学と呼ばれることが多い、人間の本性と判断に関するメンタルモデルのコレクション[6]は、コンサルティングとAIの旅の両方で私に大きな影響を与えました。 興味深いことに、AI と行動経済学には共通の祖先があります。 ハーバート サイモンの限定合理性の概念は、「人間は理想的な合理的な意思決定者である」という一般的な見方に疑問を投げかけ、代わりに、私たちは思考能力、入手可能な情報、時間に制限されて決定を行うと主張しました [14]。 これは、15 年代後半から勢いを増している行動経済学の分野 [17–1900] の基礎でした。 サイモンはまた、AIの創設者の一人と見なされており、ヒューリスティックプログラムの開発と人間の問題解決に関する彼の研究は、将来の象徴的なAIシステムの基礎を築きました。 彼の言葉 [14] では、

限定合理性の原則は、複雑な問題を定式化して解決するための人間の心の能力は、現実の世界で客観的に合理的な行動をとるために、あるいは合理的な近似のために解決が必要な問題のサイズと比較して非常に小さいです。そのような客観的な合理性。

過去数十年にわたって、行動経済学は、人間が意思決定を行う方法[15]、意思決定を行うための基礎となるプロセス[16]、理想的な効用最大化からどのように逸脱するかについて、学術およびビジネスの世界に大きな影響を与えてきました。経済的観点、および彼ら自身の利益のために特定の決定に向けて彼らをどのように動かすか[17]。

行動(経済)思考 (または 行動的思考 略して)は、人間がどのように行動するかに焦点を当てた思考パターンです 本当に 方法とは対照的に決定を下す べきである 決定を下すために。 エージェントベースの考え方を使用する場合、人間がどのように意思決定を行うかを理解する必要があることがよくあります (たとえば、どの商品を購入するか、いくら投資するかなどの決定)。 アンカリング、デフォルト、バンドワゴン効果、損失回避、双曲割引、およびその他のヒューリスティックの膨大なリストなどの行動経済学の原則は、さまざまなシナリオで意思決定を行う方法を説明しようとしています。

データサイエンティストとして、私は行動的思考がXNUMXつの特定の方法で役立つと感じています。 まず、データサイエンティストによって構築されたモデルが人間によってどのように使用されるか、およびより良い採用に必要な説明を理解できるように、人間がどのように意思決定を行うかを理解するのに役立ちます。 次に、エージェント内での人間の意思決定をモデル化して、全体的な動作をシミュレートまたは観察するのに役立ちます。 このXNUMX番目の側面は、エージェントベースの思考のさらなる専門化と見なすことができます。

図4:行動的思考とは何ですか? (出典:作者制作)

計算論的思考

コンピュテーショナルシンキングという用語は、18年にSeymour Papert [1980]によって最初に導入されました。しかし、コンピュータサイエンス教育の重要な要素としてのコンピュテーショナルシンキングの重要性は、Jeannette Wing [10]の論文でかなり後になりました。 コンピュテーショナル シンキングの基礎は、前世紀の後半に、科学、エンジニアリング、ビジネスのあらゆる側面へのコンピュテーショナル アプローチ、アルゴリズム的思考によって成熟してきました。

コンピュテーショナルシンキング は、構造化された問題解決、問題分解、パターン認識、一般化、およびコンピューターでコーディングおよび実行できる抽象化を強調する思考パターンです。 コンピュテーショナル シンキングは、産業革命に続く一連の革命、つまりコンピューティング革命、インターネットとスマートフォン革命、そして今ではビッグ データ、アナリティクス、AI 革命に大きな影響を与えてきました。

私が議論したこれまでの思考パターンはすべて、人間と機械の両方を理解するために適用できますが、計算的思考はインテリジェントシステムを作成するための中心です。 あるいは、他のタイプの思考をエンコードして実現するためのメカニズムとして、計算的思考を見ることができます。 したがって、データ サイエンティストとして、私たちはコンピュテーショナル シンキングで考え、提供する指示を正確に行う必要があります。

図5:計算的思考とは何ですか? (出典:作者制作)

参考文献

[1]トレントグリフィン。 メンタルモデルと世俗的な知恵についてチャーリー・マンガーから学んだXNUMXのこと。 8月の22、2015。

[2]アナンドラオ。 人間中心の AI を活用するための XNUMX の人間の能力と XNUMX 種類の知能. 中— 10年2020月XNUMX日に起動します。

[3]シェーン・パリッシュとリアノン・ボービエン。 グレート メンタル モデル ボリューム 1: 一般的な思考の概念。 Latticework Publishing Inc.2019。

[4]シェーン・パリッシュとリアノン・ボービエン。 グレート メンタル モデル ボリューム 2: 物理学、化学、および生物学。 Latticework Publishing Inc.2020。

[5] ガブリエル・ワインバーグとローレン・マッキャン。 スーパーシンキング:メンタルモデルのビッグブック。 ポートフォリオ、2019年。

【6] メンタルモデルで世界を理解する:339のモデルが頭の中で持ち運びできると説明されています。

[7] スコット・E・ペイジ。 「多くのモデル思考者」がより良い決定をする理由、ハーバードビジネスレビュー、19年2018月XNUMX日。

[8]レイラアカログル。 システム思考者のためのツール:システム思考のXNUMXつの基本概念. 中 — 破壊的なデザイン。 7 年 2017 月 XNUMX 日。

[9]アンドリュー・ヘニング。 システム思考パート1—要素、相互接続、および目標。 中 — より良いシステム。 8月の1、2018。

[10]ドネラメドウズ。 システムで考える:入門書。 チェルシーグリーンパブリッシング。 2008.

[11]ジョン・スターマン。 ビジネスダイナミクス:複雑な世界のためのシステム思考とモデリング. マグロウヒルエデュケーション。 2000年。

[12]バリー・リッチモンド。 Stellaで考えるシステム入門. ISEE システム、2004 年。

[13]バリー・リッチモンド。 システム思考における「思考」。 どうすれば習得しやすくなりますか?. システム思考家。

[14]ハーバートサイモン。 限定合理性のモデル第1巻:経済分析と公共政策。 MITプレス。 1984年。

[15] ダン・アリエリー。 予想通り不合理な改訂版と拡張版:私たちの決定を形作る隠れた力。 ハーパーコリンズ、2009年。

[16]ダニエル・カーネマン。 考えること、速くて遅い。 ファラー・ストラウスとジルー、2013年。

[17] リチャード・セイラーとキャス・サンスティーン。 ナッジ: 健康、富、幸福に関する意思決定の改善ペンギン ブックス、2009 年。

[18]シーモア・パパート。 マインドストーム:子供、コンピューター、そして強力なアイデア。 Basic Book、Inc.、1980年。

[19]ジャネット・ウィング。 コンピュテーショナルシンキング。 ACM 49(3):33- 35のコミュニケーション。

元の。 許可を得て転載。

関連する

コインスマート。 BesteBitcoin-ヨーロッパのBörse
出典: https://www.kdnuggets.com/2021/06/five-types-thinking-data-scientist.html

スポット画像

最新のインテリジェンス

スポット画像

私たちとチャット

やあ! どんな御用でしょうか?