Logo Zephyrnet

Dự đoán thành công của VC với dữ liệu Crunchbase

Ngày:

By Người cho vay Mason

Sử dụng số liệu thống kê để dự đoán sự thành công của một dự án kinh doanh không phải là điều mới lạ. Công việc và nghiên cứu hiện tại trong không gian VC xem xét việc dự đoán sự thành công của các công ty khởi nghiệp và phân tích những đặc điểm nào là quan trọng nhất trong việc phân biệt những người sáng lập đặc biệt thành công.

Nhiều nỗ lực trong số này sử dụng học máy, học sâu và các mô hình thống kê khác.

Mason Lender, tác giả khách mờiMason Lender, tác giả khách mời
Người cho vay Mason

Các công ty liên doanh nổi tiếng như liên doanh tương quan, GVLiên doanh Ulu cũng sử dụng các mô hình của riêng họ, thường sử dụng dữ liệu độc quyền để dự đoán kết quả của một dự án kinh doanh nhằm đưa ra quyết định đầu tư tốt hơn.

Nhưng trong khi nhiều nghiên cứu tập trung vào các quyết định đầu tư thì lại có rất ít nghiên cứu về bản thân các nhà đầu tư mạo hiểm, cụ thể là: Điều gì tạo nên một nhà đầu tư mạo hiểm thành công?

Vào mùa thu năm 2000, một nhóm gồm ba tác giả đã xuất bản một bài báo có tựa đề “Điều gì tạo nên một nhà đầu tư mạo hiểm thành công?” đang cố gắng trả lời chính câu hỏi đó. Các tác giả bắt đầu bằng việc tiến hành một cuộc khảo sát với 145 quỹ đầu tư mạo hiểm nhằm làm sáng tỏ bất kỳ đặc điểm hoặc hoàn cảnh nào có thể dẫn đến thành công trong lĩnh vực đầu tư mạo hiểm.

Họ thăm dò các VC về kỹ năng, kinh nghiệm và lý do họ gia nhập ngành. Trong số những phát hiện khác, họ phát hiện ra rằng mặc dù bằng MBA hoặc bằng cấp kỹ thuật khác “rất hữu ích nhưng nó không cần thiết để thành công” trong ngành VC.

Họ cũng lưu ý rằng “các kỹ năng mềm được đánh giá cao hơn các kỹ năng định lượng” như kế toán hoặc tài chính và trí thông minh tổng thể được cho là “rất quan trọng”.

Để khám phá xem những phát hiện này có giá trị ngày nay hay không và để xem ngành này có thể đã thay đổi như thế nào trong 20 năm kể từ khi nghiên cứu này được thực hiện lần đầu, tôi đã viết luận án của mình khi đang ở trường. đại học Yale xem xét một cách định lượng những yếu tố nào tạo nên một VC tốt.

Đối với tìm kiếm của tôi, tôi đã sử dụng Crunchbase và cơ sở dữ liệu phong phú về thông tin công ty tư nhân, thông tin chi tiết về đầu tư và dữ liệu cá nhân. Đây là những gì tôi tìm thấy.

Đầu tiên, 'thành công' trong VC là gì?

Trước khi tạo mô hình để phân tích và dự đoán các nhà đầu tư mạo hiểm thành công, tôi cần xác định một nhà đầu tư mạo hiểm thành công. Một quan niệm phổ biến trong ngành đầu tư mạo hiểm là các quỹ đầu tư mạo hiểm được thúc đẩy bởi các khoản đầu tư ngoại lai; một khoản đầu tư tuyệt vời có thể mang lại lợi nhuận cực cao gấp 100 lần hoặc thậm chí 1,000 lần.

Do đó, một nhà đầu tư thực sự thành công sẽ có khả năng khám phá những khoản đầu tư tuyệt vời này. Một thước đo cho một khoản đầu tư đáng kinh ngạc là đầu tư vào một công ty kỳ lân, hoặc một công ty tư nhân có giá trị bằng hoặc vượt quá 1 tỷ USD. Do đó, bất kỳ khoản đầu tư mạo hiểm nào trở thành kỳ lân đều là một khoản đầu tư cực kỳ thành công.

Đối với phân tích này, tôi đã phân loại các khoản đầu tư tuyệt vời là khoản đầu tư vào các dự án kỳ lân có giá trị hiện tại vượt quá 1 tỷ USD, vì dữ liệu Crunchbase không bao gồm bội số trên vốn đầu tưhoặc MOIC hoặc các số liệu đủ khác để phân loại lợi tức đầu tư.

Tôi cũng đã sử dụng hai bộ dữ liệu khác. Một là CB Insights, chứa thông tin về các công ty kỳ lân thuộc sở hữu tư nhân.

Một thước đo khác nhưng có thể so sánh được để định giá các công ty đại chúng là vốn hóa thị trường, hoặc tổng giá trị toàn bộ cổ phiếu của một công ty. Số liệu này có thể giúp so sánh quy mô tương đối của công ty này với công ty khác. Để có được tổng vốn hóa thị trường của các dự án mạo hiểm trong bộ dữ liệu Crunchbase, tôi đã sử dụng Công tyMarketCap.

Mặc dù các công ty kỳ lân đều là tư nhân, nhưng phân tích của tôi không liên quan đến các dự án đầu tư tư nhân hay công cộng, phân loại bất kỳ liên doanh nào có giá trị vượt quá 1 tỷ USD là “khoản đầu tư kỳ lân”.

Để trở thành một nhà đầu tư mạo hiểm thành công, một người phải là người quản lý tốt nguồn vốn mà họ quản lý.

Trong hầu hết các trường hợp, các công ty đầu tư mạo hiểm nhận được nguồn tài trợ từ các đối tác hữu hạn. Các đối tác hữu hạn chọn các quỹ mà họ tin rằng phù hợp với triết lý đầu tư của họ và sẽ mang lại cho họ lợi nhuận cao.

Đối tác tại một công ty liên doanh, vị trí quản lý cao nhất trong công ty, phải xử lý tiền của họ một cách cẩn thận, tiến hành thẩm định kỹ lưỡng mọi quyết định đầu tư để tăng khả năng thu được lợi nhuận tốt hơn.

Các đối tác liên doanh có quyền lợi đặc biệt đối với sự thành công của khoản đầu tư của họ. Đầu tư thành công và quỹ có lợi cho các đối tác. Nó giúp ích cho danh tiếng của các nhà đầu tư và công ty, cho phép huy động vốn trong tương lai dễ dàng hơn từ các đối tác hữu hạn và các đối tác nhận được tiền lãi từ tiền và khoản đầu tư. Nhà đầu tư thành công là người mang lại lợi nhuận cao từ khoản đầu tư. Một cách phổ biến để đo lường thành công là xem xét MOIC của nhà đầu tư, đo lường hiệu suất của một khoản đầu tư hoặc nhà đầu tư. Nó so sánh giá trị của một khoản đầu tư so với chi phí ban đầu của nó.

Số liệu này thường được sử dụng trong thị trường tư nhân, bao gồm vốn cổ phần tư nhân và vốn mạo hiểm. Việc tính toán MOIC của nhà đầu tư hoặc quỹ được thực hiện bằng cách chia tổng giá trị đầu tư (đã thực hiện và chưa thực hiện) cho khoản đầu tư ban đầu. Tuy nhiên, MOIC không nắm bắt hoặc đưa ra thước đo thành công theo thời gian. Thật không may, số liệu này không được công bố rộng rãi.

Tạo mô hình để dự đoán thành công

Sau khi làm sạch, khám phá và cắt bớt tập dữ liệu Crunchbase, tôi đã trang bị mô hình hồi quy logistic. Giống như các quỹ đầu tư mạo hiểm tìm cách dự đoán và thực hiện các khoản đầu tư ngoại lệ, nghiên cứu này nhằm mục đích dự đoán các nhà đầu tư mạo hiểm ngoại lệ hơn. Tôi đã tạo ra một số mô hình khác nhau xem xét hai yếu tố - giáo dục và sự nghiệp - ảnh hưởng như thế nào đến thành công của một nhà đầu tư mạo hiểm.

Trong mỗi mô hình, biến kết quả là nhị phân - liệu nhà đầu tư có thực hiện đầu tư kỳ lân hay không.

Các hệ số cụ thể của mô hình được thảo luận dưới đây, nhưng nói chung, hệ số dương cho một biến dự đoán cho thấy rằng việc tăng mức dự đoán đó (hoặc một mức nhất định của biến dự đoán đó) có liên quan đến tỷ lệ logarit tăng lên của một khoản đầu tư là một khoản đầu tư kỳ lân. (xác suất tăng).

Ví dụ: hệ số dương khi đã theo học tại 25 trường đại học hàng đầu cho thấy tỷ lệ chênh lệch nhật ký tăng đối với khoản đầu tư là kỳ lân, trong khi hệ số âm đối với chỉ số dự đoán của người sáng lập có nghĩa là tỷ lệ chênh lệch nhật ký dự đoán của khoản đầu tư kỳ lân giảm.

Mô hình 1: Giáo dục

Biểu đồ trên hiển thị các hệ số của các yếu tố dự báo liên quan đến giáo dục, bao gồm môn học đã học, một chỉ báo xem cá nhân đó có hoàn thành bằng cấp của mình hay không và chỉ báo về việc đã theo học tại một trường đại học thuộc top 25.

Các hệ số được sắp xếp từ trên xuống dưới theo tác động tích cực lớn nhất đến ít được dự đoán nhất đối với tỷ lệ chênh lệch log của khoản đầu tư kỳ lân. Các dải màu xanh lam dài trải dài trên mỗi điểm hệ số biểu thị khoảng tin cậy 95% cho hệ số dự đoán. Tất cả các hệ số có dải không chạm 0 được coi là có ý nghĩa thống kê ở mức alpha 0.05.

Mô hình này có ý nghĩa gì theo thuật ngữ của giáo dân?

Khi nhìn vào hệ số môn học, có vẻ như các môn khoa học máy tính, luật và kinh doanh có hệ số cao nhất. Do đó, mô hình hồi quy logistic dự đoán rằng việc giữ tất cả các yếu tố khác bằng nhau đối với khoản đầu tư được quy cho nhà đầu tư đã nghiên cứu một trong những lĩnh vực đó sẽ có tác động tích cực đáng kể đến tỷ lệ chênh lệch log của khoản đầu tư là kỳ lân khi so sánh với đường cơ sở phạm trù của một chủ đề nghệ thuật được nghiên cứu.

Giả thuyết sau đây có thể minh họa rõ hơn khái niệm này. Giả sử một nhà đầu tư học ngành khoa học máy tính để lấy bằng đại học tại Yale. Nếu cá nhân này thực hiện một số khoản đầu tư, phép tính sau đây có thể được sử dụng để tính tỷ lệ cược log của khoản đầu tư kỳ lân:

Trong ví dụ trên, việc có được bằng cấp về khoa học máy tính tại một trường đại học thuộc top 25 sẽ làm tăng tỷ lệ đăng nhập (xác suất) của một nhà đầu tư ngoại lệ (một người đã thực hiện khoản đầu tư kỳ lân).

Sự nghiệp cho chúng ta biết gì về thành công của VC

Người ta nên đánh giá công việc trước đây hoặc lựa chọn nghề nghiệp của nhà đầu tư như thế nào khi dự đoán thành công của họ?

Trong mô hình thứ hai, tôi tìm cách trả lời câu hỏi này. Cách giải thích biểu đồ tiếp theo rất giống với biểu đồ hệ số giáo dục, nhưng thay vào đó, các biến liên quan đến nghề nghiệp bên dưới được vẽ biểu đồ. Ở đây, biểu đồ hiển thị các hệ số của các yếu tố dự đoán liên quan đến nghề nghiệp, bao gồm cả công việc trước đây của một nhà đầu tư, cũng như chỉ báo xem cá nhân đó có phải là người sáng lập trong quá khứ hay không.

Một lần nữa, các hệ số được sắp xếp từ trên xuống dưới theo mức độ lớn nhất (xác suất tăng) của khoản đầu tư kỳ lân cho đến tác động tích cực ít được dự đoán nhất.

Trong mô hình này, hai loại công việc trước đây dường như có ý nghĩa thống kê: nhân viên ngân hàng đầu tư và tư vấn quản lý. Danh mục cơ bản cho các công việc trước đây được đặt là làm việc tại năm ngân hàng đầu tư lớn: JPMorgan Chase, Goldman Sachs, Chứng khoán BofA, Morgan StanleyCitigroup.

Mô hình 2: Sự nghiệp

Mỗi hệ số beta tương ứng với sự khác biệt về tỷ lệ cược/xác suất của một khoản đầu tư là khoản đầu tư kỳ lân từ danh mục cơ sở này.

Người sáng lập không nhất thiết phải là nhà đầu tư giỏi hơn

Một kết quả thú vị của mô hình này là tác động của hệ số sáng lập. Mô hình này dự đoán rằng nếu một đối tác đầu tư là người sáng lập trước đó thì xác suất dự đoán hoặc tỷ lệ ghi lại khoản đầu tư đó trở thành kỳ lân thực sự sẽ giảm.

Đây là một hiện tượng thú vị vì theo trực giác, người ta có thể nghĩ rằng người sáng lập sẽ là người đánh giá tốt hơn trong việc tìm kiếm những người sáng lập kỳ lân.

Tuy nhiên, trên thực tế, việc trở thành người sáng lập có thể làm điều ngược lại. Tuy nhiên, kết quả này mâu thuẫn với quan điểm của Brett Rhyne. nghiên cứu cho thấy các quỹ đầu tư mạo hiểm từng là người sáng lập các công ty khởi nghiệp thành công có tỷ lệ đầu tư thành công cao hơn so với các quỹ đầu tư mạo hiểm không phải là người sáng lập.

Mô hình trên không xem xét sự thành công của người sáng lập VC mà xem xét liệu họ đã từng là người sáng lập trước đó hay chưa. Các kết quả khác nhau có thể được giải thích bởi một số nhà sáng lập không thành công là những nhà đầu tư mạo hiểm kém, nhưng cần phải phân tích thêm.

Vậy tất cả những điều này có ý nghĩa gì?

Tại sao làm tất cả điều này? Và tất cả điều này có nghĩa là gì? Cũng giống như nhiều quỹ đầu tư mạo hiểm tiến hành phân tích và thẩm định đối với người sáng lập và công ty khởi nghiệp trước khi đầu tư, hoạt động này có thể giúp các đối tác hữu hạn hoặc quỹ đầu tư mạo hiểm thuê được những nhà đầu tư tốt hơn.

Dựa trên phân tích của dự án này và các mô hình được thực hiện, LP có thể xem xét các yếu tố hoặc yếu tố dự đoán quan trọng hơn được nêu bật trong các mô hình trên.

Khi lựa chọn nhà đầu tư để cấp vốn hoặc khi các công ty đầu tư mạo hiểm thuê hoặc thăng chức cho đối tác, phân tích tương tự có thể mang lại lợi nhuận tốt hơn. Với những hạn chế của dữ liệu Crunchbase, các công ty VC không nên thay đổi chiến lược tuyển dụng của mình và LP không nên thay đổi việc phân bổ vốn.

Đúng hơn, dự án này có thể nêu bật những hướng nghiên cứu mới sẽ được thực hiện với dữ liệu rõ ràng hơn, chính xác hơn. Trong một ngành mà việc chuyển giao một khoản đầu tư có thể tốn hàng tỷ USD lợi nhuận thì việc lựa chọn cá nhân phù hợp cho công việc là điều quan trọng nhất.

Dựa trên phân tích và mô hình, các công ty đầu tư mạo hiểm và LP nên xem xét các đối tượng được nghiên cứu, các công việc trước đây đã đảm nhiệm và các cơ sở giáo dục mà các nhà đầu tư mạo hiểm theo học để có thông tin tốt hơn về việc phân bổ vốn của họ.

Nghiên cứu sâu hơn có thể xem xét hoặc bao gồm các yếu tố khác bao gồm tuổi tác, số năm kinh nghiệm trong công việc hoặc có thể là phong cách đầu tư.


Mason Lender vừa tốt nghiệp từ đại học Yale với chuyên ngành kép về thống kê và khoa học dữ liệu và các vấn đề toàn cầu. Hiện nay anh đang xây dựng một công ty với Doanh nhân đầu tiên ở New York. Trước đây ông làm việc cho Google, McKinsey & Co. và với các công ty khởi nghiệp.

Phương pháp: Ghi chú về dữ liệu

Tôi xin cảm ơn Brian Macdonald, Tiến sĩ, Khoa Thống kê & Khoa học Dữ liệu tại Đại học Yale, và Jorge Torres, JD, giảng viên, đồng nghiệp Kỹ thuật & Doanh nhân Yale, Trung tâm Tư duy Đổi mới Tsai tại Yale. Sự hỗ trợ và hướng dẫn của họ trong suốt dự án này đã giúp điều đó trở thành hiện thực. — Người cho vay Mason

Tôi bắt đầu với việc làm sạch, khám phá và trực quan hóa dữ liệu của tập dữ liệu Crunchbase. Tôi bắt đầu bằng cách thu hẹp trọng tâm của mình bằng cách vạch ra cơ sở dữ liệu Crunchbase như sau:

Bộ dữ liệu Crunchbase được chia theo danh mục thành nhiều bảng tính với các khóa duy nhất có liên quan để ánh xạ.

Đó là một cơ sở dữ liệu quan hệ lớn với thông tin về các nhà đầu tư (cá nhân, công ty và quỹ của họ), liên doanh (tổ chức/công ty và các tổ chức con) và con người (nhà đầu tư và người sáng lập).

Chúng ta có thể hình dung mối liên kết giữa mỗi csv với các đường nối các khóa của chúng ở trên. Để nghiên cứu, tôi chủ yếu dựa vào Investor_partners.csv.

Tệp này chứa mọi khoản đầu tư được lưu trữ trong tập dữ liệu của Crunchbase có ghi công hoặc được ghi có cho đối tác đầu tư. Các đối tác đầu tư này là đối tác tại các công ty đầu tư mạo hiểm đưa ra quyết định cuối cùng về đầu tư. Việc bổ sung dữ liệu được lưu trữ trong Investor_partners.csv, Degrees.csv và People_descriptions.csv đã được tận dụng để thêm nhiều trường và chỉ số dự đoán hơn cho phân tích của tôi.

Hình minh họa: Dom Guzman

Tìm kiếm ít hơn. Đóng nhiều hơn.

Tăng doanh thu của bạn bằng các giải pháp tìm kiếm tất cả trong một được cung cấp bởi công ty dẫn đầu về dữ liệu của công ty tư nhân.

Luôn cập nhật các vòng tài trợ, mua lại gần đây và hơn thế nữa với
Crunchbase hàng ngày.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img