ゼファーネットのロゴ

メディアおよびエンターテインメント業界で役立つ洞察を引き出すためのデータの構造化

日付:

目次

ハルシット・プリ

私は 2019 年にスワミ ヴィヴェカナンド スハルティ大学でコンピュータ アプリケーションの学士号を取得しました。その後、新興企業の米国拠点プロジェクトでデータ アナリストとして働き始めました。 私の仕事分野は、クライアントのデータベースを保守し、日常業務を処理することです。 データがどのように機能するかについての戦術的な知識を持っているので、私の情熱はチャンスを探ることです。 そこで私は、より優れた意思決定主導型のデータ アナリストになるために、E-Com、フィンテック、教育、旅行などのさまざまな業界領域と、学術分野を超えた分析分野でのそれらの応用を検討しました。 現在、エディタージでデータアナリストとして働いています。 この組織にデータ アナリストとして参加する前は、州政府が後援するプロジェクトであるデリー公立学校で職業トレーナーとして働いていました。

問題文: 以前は、構造化されておらず、推論を得るために分析するのが難しい大量のデータを取得していました。 私の役割は、より適切な分析のためにデータを構造化することでした。 ビジネスの観点から結果を説明するには、適切な方法論を選択し、データをさらに分析する必要がありました。 これらは職場で直面する大きな問題でした。 Editorji はプラットフォーム上のユーザー エンゲージメントに大きく依存しています。 さらに、方法論の変更により、プラットフォームでのユーザー エンゲージメントが安定しません。 ただし、外れ値が多数あるため、ユーザー エンゲージメントを予測して分析するのはそれほど簡単ではありません。

データの中で。 また、データベースは現在テストモードです。 たとえば、例を挙げて説明します。Editorji はデジタル メディア ニュース組織であり、当社のプラットフォームに毎日コンテンツをアップロードしています。 コンテンツやニュースが 1 日目にアップロードされた場合、ユーザーは 100 日目にもそのニュースを閲覧できる可能性があるため、データによる予測は不可能です。 仮説や予測を立てるのにデータは信頼できませんでした。 したがって、DB がテストモードであり、データが構造化されておらず、当面はスキーマを作成できないため、アプリケーションとプラットフォームを成長させるための洞察は的を得ていません。

使用したツールとテクニック:

ステップ 1: データベースが構造化されておらず、データベース内にスキーマが存在しないため。 MongoDBデータベースをJupyterに接続してみました。 データを一目見るには、テスト モードなので、データベースにあるデータが評価できるかどうか、または何らかの問題があるかどうかをテストする必要がありました。 データを構造化された形式で表現するための問題を解決するために Python を使用しました。

ステップ 2: 構造化データから関連情報を特定します。 これには、XNUMX か月間のプラットフォーム上のビューやエンゲージメント % が増加したかどうかなどの情報が含まれます。

ステップ 3: Python を使用して、プラットフォームにアクセスするユーザーの数、プラットフォームにアクセスする頻度、通知をクリックする/ビデオを視聴する (XNUMX 回または XNUMX 回) ことも特定しました。 注意すべき重要な点は、ユーザーが XNUMX か月後に同じビデオを視聴した場合、この場合の外れ値はかなり高くなるということです。

ステップ 4: ユニーク ユーザーのデータが分析され、実際にメディア Web サイトにアクセスして通知をクリックできたユーザーの数が分析されました。 Python はユーザー トラフィックの分析に役立ちました。

洞察: Pythonでデータベースに接続した後。 ユーザー維持率が年々増加していることがわかりました。 しかしまた、年間ベースで見ると、平均インストール率は平均アンインストール率を下回っています。 重要な観察結果は次のとおりです。

1. プラットフォームにアクセスするユーザーの数

2. XNUMX 回または XNUMX 回クリックしたユーザーは何人ですか

3. 外れ値が多く予測が困難であった

4. テストチームは行われた分析から推論を導き出すことができます

解決策/推奨事項: 

この問題の解決策は、PAN India への到達可能性を高める別の方法を見つけることです。 私たちのプラットフォームを SSP と DSP にすることが私のチームが提案した提案でした。 ここで注意すべき重要な点は、ユニーク ユーザーを分析対象として考慮する際に、このデータが役立つということです。

生成された影響: 分析に Python を使用した後、ユーザーの維持率が向上することがわかりました。 第 1 四半期には最大 13.4% まで増加し、第 2 四半期には最大 19.5% まで増加しました。 これに加えて、アプリケーションのダウンロード数も 11.49 年 2022 月から XNUMX 月にかけて XNUMX% 増加しました。おそらく、今後はデマンドサイド プラットフォーム (DSP) として大きな強気企業と協力することになるでしょう。 作業は進行中です。 これは、データ アナリストとしての私の進歩に役立ちました。 また、MongoDB コンパスや Power BI などの他のツールも検討しています。 信頼できないデータがどのようにして可能性のある洞察を与えるのかを理解しました。

スポット画像

最新のインテリジェンス

スポット画像