Zephyrnet-logo

Succes van VC voorspellen met Crunchbase-gegevens

Datum:

By Mason Lener

Het gebruik van statistieken om het succes van een onderneming te voorspellen is niet nieuw. Huidig ​​werk en onderzoek binnen de VC-ruimte richt zich op het voorspellen van het succes van startups en het analyseren van welke kenmerken het belangrijkst zijn bij het onderscheiden van uitzonderlijk succesvolle oprichters.

Bij veel van deze inspanningen wordt gebruik gemaakt van machine learning, deep learning en andere statistische modellen.

Mason Lender, gastauteurMason Lender, gastauteur
Mason Lener

Bekende durfondernemingen zoals Correlatie-ondernemingen, GV en Ulu-ondernemingen maken ook gebruik van hun eigen modellen, waarbij ze vaak bedrijfseigen gegevens gebruiken om de uitkomst van een onderneming te voorspellen, zodat ze hun investeringsbeslissingen beter kunnen onderbouwen.

Maar hoewel veel onderzoek zich heeft gericht op investeringsbeslissingen, is er weinig gericht op het bestuderen van de durfkapitalisten zelf, met name: wat maakt een succesvolle durfkapitalist?

In de herfst van 2000 publiceerde een team van drie auteurs een artikel met de titel “Wat maakt een succesvolle durfkapitalist?” die vraag proberen te beantwoorden. De auteurs begonnen met het uitvoeren van een onderzoek onder 145 durfkapitaalfondsen, met als doel kenmerken of omstandigheden te belichten die tot succes binnen durfkapitaal kunnen leiden.

Ze ondervroegen VC's over hun vaardigheden, ervaringen en redenen om zich bij de sector aan te sluiten. Ze ontdekten onder meer dat, hoewel een MBA of een andere technische graad “zeer nuttig is, deze niet vereist is voor succes” in de VC-industrie.

Ze merkten ook op dat ‘zachte vaardigheden hoger worden gewaardeerd dan kwantitatieve vaardigheden’, zoals boekhouding of financiën, en dat algemene intelligentie als ‘zeer belangrijk’ wordt aangehaald.

Om te onderzoeken of deze bevindingen vandaag de dag geldig zijn, en om te zien hoe de industrie in de twintig jaar sinds dit onderzoek oorspronkelijk werd gedaan, zou kunnen zijn veranderd, schreef ik mijn proefschrift toen ik aan de slag ging. Yale universiteit kwantitatief kijken naar welke factoren een goede VC vormen.

Voor mijn zoektocht heb ik gebruikt CrunchBase en de rijke database met informatie over particuliere bedrijven, beleggingsinzichten en persoonlijke gegevens. Dit is wat ik heb gevonden.

Ten eerste: wat is 'succes' in VC?

Voordat ik een model creëerde om succesvolle durfkapitalisten te analyseren en te voorspellen, moest ik een succesvolle durfkapitalist definiëren. Een veelvoorkomend idee in de durfkapitaalsector is dat durfkapitaalfondsen worden aangestuurd door outlier-investeringen; één enkele uitstekende investering kan een extreem rendement hebben van 100x of zelfs 1,000x.

Een echt succesvolle belegger zal daarom de mogelijkheid hebben om deze uitstekende beleggingen te ontdekken. Eén maatstaf voor een ongelooflijke investering is die in een eenhoornbedrijf, of a particuliere onderneming waarvan de waarde $1 miljard of meer bedraagt. Elke durfinvestering die een eenhoorn wordt, is dus een uiterst succesvolle investering.

Voor deze analyse heb ik uitstekende investeringen geclassificeerd als investeringen in unicorn ventures met een huidige waarde van meer dan $1 miljard, aangezien Crunchbase-gegevens geen rekening houden met multiple op geïnvesteerd vermogen, of MOIC, of ​​andere voldoende maatstaven voor het categoriseren van het rendement op investeringen.

Ik heb ook twee andere datasets gebruikt. Een was CB Insights, dat informatie bevat over particuliere unicorn-bedrijven.

Een andere, maar toch vergelijkbare maatstaf om beursgenoteerde bedrijven te waarderen is de marktkapitalisatie de totale waarde van alle aandelen van een bedrijf. Deze maatstaf kan helpen bij het vergelijken van de relatieve omvang van het ene bedrijf met het andere. Om de totale marktkapitalisatie van ondernemingen in de Crunchbase-dataset te verkrijgen, heb ik gebruikt BedrijvenMarketCap.

Hoewel unicorn-bedrijven allemaal particulier zijn, was mijn analyse agnostisch ten opzichte van particuliere of publieke ondernemingen, waarbij ik elke onderneming waarvan de waarde groter is dan $ 1 miljard als een ‘eenhoorninvestering’ categoriseerde.

Om een ​​succesvolle durfkapitalist te zijn, moet iemand een goede beheerder zijn van het kapitaal dat hij beheert.

In de meeste gevallen ontvangen durfkapitaalbedrijven hun financiering van beperkte partners. Limited partners selecteren fondsen waarvan zij denken dat ze aansluiten bij hun beleggingsfilosofie en een hoog rendement zullen opleveren.

Een partner bij een durfkapitaalbedrijf, de hoogste bestuurspositie binnen het bedrijf, moet zorgvuldig met zijn geld omgaan en bij elke investeringsbeslissing een due diligence uitvoeren om de kans op een beter rendement te vergroten.

Venturepartners hebben een gevestigd belang bij het succes van hun investeringen. Succesvolle investeringen en fondsen zijn gunstig voor partners. Het komt de reputatie van de investeerders en het bedrijf ten goede, maakt het gemakkelijker om toekomstig kapitaal aan te trekken bij commanditaire vennoten, en partners ontvangen een bijdrage op de opbrengst van de fondsen en de investeringen. Een succesvolle belegger is iemand die een hoog rendement op zijn beleggingen behaalt. Een veelgebruikte manier om succes te meten is door te kijken naar de MOIC van een belegger, die de prestaties van een belegging of investeerder meet. Het vergelijkt de waarde van een investering in verhouding tot de initiële kosten.

Deze maatstaf wordt vaak gebruikt op particuliere markten, waaronder private equity en durfkapitaal. Het berekenen van de MOIC van een investeerder of fonds gebeurt door de totale waarde van de investeringen (gerealiseerde en niet-gerealiseerde) te delen door de initiële investering. MOIC registreert of produceert echter geen tijdgewogen meting van succes. Helaas is deze statistiek niet openbaar beschikbaar.

Een model genereren om succes te voorspellen

Na het opschonen, verkennen en bijsnijden van de Crunchbase-dataset heb ik een logistisch regressiemodel geïnstalleerd. Net zoals durfkapitaalfondsen uitschieters willen voorspellen en investeringen willen doen, leek dit onderzoek ook uitschieters van durfkapitalisten te voorspellen. Ik heb verschillende modellen gemaakt waarin ik heb gekeken naar hoe de twee factoren – opleiding en carrière – het succes als durfkapitalist beïnvloeden.

In elk model is de uitkomstvariabele binair: of een investeerder wel of niet een eenhoorninvestering zou doen.

De specifieke coëfficiënten van het model worden hieronder besproken, maar in het algemeen geeft een positieve coëfficiënt voor een voorspellende variabele aan dat het verhogen van die voorspeller (of een bepaald niveau van die voorspeller) geassocieerd is met een verhoogde log odds dat een investering een eenhoorninvestering is. (verhoogde waarschijnlijkheid).

Een positieve coëfficiënt voor het hebben bezocht aan een top 25-universiteit duidt bijvoorbeeld op een verhoogde log odds ratio voor een investering die een eenhoorn is, terwijl een negatieve coëfficiënt voor de voorspeller van de oprichterindicator een afname betekent van de voorspelde log odds ratio van een eenhoorninvestering.

Model 1: Onderwijs

De grafiek hierboven geeft de coëfficiënten weer van de onderwijsgerelateerde voorspellers, waaronder het bestudeerde onderwerp, een indicator of het individu zijn of haar diploma heeft behaald en een indicator voor het hebben bezocht aan een top 25-universiteit.

De coëfficiënten zijn gerangschikt van boven naar beneden op basis van de grootste tot de minst voorspelde positieve impact op de log odds ratio van een eenhoorninvestering. De lange blauwe banden die elk coëfficiëntpunt omspannen vertegenwoordigen het 95% betrouwbaarheidsinterval voor de voorspelde coëfficiënt. Alle coëfficiënten waarvan de banden de 0 niet raken, worden als statistisch significant beschouwd op het alfaniveau van 0.05.

Wat betekent dit model in termen van de leek?

Als we naar de vakcoëfficiënten kijken, blijkt dat informatica, rechten en bedrijfskunde de hoogste coëfficiënten hebben. Het logistische regressiemodel voorspelt dus dat als al het andere gelijk wordt gehouden, een investering met toeschrijving aan een investeerder die een van die velden heeft bestudeerd, een aanzienlijk positief effect zou hebben op de log odds ratio van de investering als een eenhoorn in vergelijking met de basislijn. categorie van een kunstvak dat wordt bestudeerd.

De volgende hypothese kan dit concept beter illustreren. Stel dat een investeerder informatica heeft gestudeerd voor zijn bachelordiploma aan Yale. Als deze persoon een investering zou doen, zou de volgende berekening kunnen worden gebruikt om de log odds van de eenhoorninvestering te berekenen:

In het bovenstaande voorbeeld vergroot het behalen van een graad in computerwetenschappen aan een top 25-universiteit de log odds (waarschijnlijkheid) van een outlier-investeerder (iemand die een unicorn-investering heeft gedaan).

Welke carrière vertelt ons over VC-succes

Hoe moet je de eerdere banen of carrièrekeuzes van een belegger waarderen bij het voorspellen van hun succes?

In het tweede model probeer ik deze vraag te beantwoorden. De daaropvolgende plotinterpretatie lijkt sterk op die van de opleidingscoëfficiëntplot, maar hieronder worden in plaats daarvan carrièregerelateerde variabelen uitgezet. Hier toont de grafiek de coëfficiënten van de carrièregerelateerde voorspellers, inclusief de eerdere baan van een investeerder, evenals een indicator of het individu een voormalige oprichter is.

Opnieuw worden de coëfficiënten van boven naar beneden geordend op basis van de grootste (toename van de waarschijnlijkheid) van een eenhoorninvestering tot het minst voorspelde positieve effect.

In dit model lijken twee soorten eerdere banen statistisch significant te zijn: investeringsbankiers en managementconsultants. De basiscategorie voor eerdere banen is werken bij een grote vijf investeringsbank: JPMorgan Chase, Goldman Sachs, BofA-effecten, Morgan Stanley en Citigroup.

Model 2: Carrière

Elke bètacoëfficiënt komt overeen met het verschil in log odds ratio/kans dat een belegging een eenhoornbelegging is uit deze basiscategorie.

Oprichters zijn niet noodzakelijkerwijs betere investeerders

Een interessante uitkomst van dit model is het effect van de oprichterscoëfficiënt. Dit model voorspelt dat als een investeringspartner een eerdere oprichter was, de voorspelde waarschijnlijkheid of logkans dat die investering een eenhoorn is, feitelijk afneemt.

Dit is een interessant fenomeen, omdat je intuïtief zou kunnen denken dat een oprichter een betere inschatting zou kunnen maken van het vinden van eenhoornstichters.

Als oprichter kan het echter juist het tegenovergestelde betekenen. Dit resultaat is echter in tegenspraak met dat van Brett Rhyne Uit een onderzoek blijkt dat durfkapitaalfondsen die ooit oprichters waren van succesvolle startups een hoger slagingspercentage hebben bij hun investeringen in vergelijking met durfkapitaalfondsen die geen oprichters zijn.

Het bovenstaande model houdt geen rekening met het succes van de VC-oprichter, maar met de vraag of hij of zij eerder oprichter is geweest. De verschillende resultaten kunnen worden verklaard doordat sommige niet-succesvolle oprichters slechte durfkapitaalfondsen waren, maar er is meer analyse nodig.

Wat betekent dit allemaal?

Waarom dit allemaal doen? En wat betekent dit allemaal? Net zoals veel durfkapitaalfondsen analyses en due diligence uitvoeren op een oprichter en startup voordat ze een investering doen, kan deze oefening beperkte partners of durfkapitaalfondsen helpen betere investeerders aan te trekken.

Op basis van de analyse van dit project en de gemaakte modellen kunnen LP's kijken naar andere belangrijke factoren of voorspellers die in de bovenstaande modellen naar voren komen.

Bij het selecteren van investeerders om te financieren, of wanneer durfkapitaalbedrijven partners inhuren of promoten, kan een soortgelijke analyse vruchtbaar blijken te zijn voor betere rendementen. Met de beperkingen van de Crunchbase-gegevens mogen durfkapitaalbedrijven hun wervingsstrategie niet veranderen en mogen LP's de toewijzing van fondsen niet veranderen.

In plaats daarvan zou dit project nieuwe wegen van onderzoek kunnen belichten die kunnen worden uitgevoerd met schonere, nauwkeurigere gegevens. In een sector waar het doorgeven van een investering miljarden aan rendement kan kosten, is het selecteren van de juiste persoon voor de baan van het allergrootste belang.

Op basis van de analyse en het model zouden durfkapitaalbedrijven en LP's de bestudeerde onderwerpen, eerdere banen en onderwijsinstellingen die door durfkapitaalfondsen bezochten, moeten onderzoeken om hun toewijzing van fondsen beter te kunnen informeren.

Bij verder onderzoek kan worden gekeken naar andere factoren, zoals leeftijd, aantal jaren ervaring in een baan of mogelijk beleggingsstijl.


Mason Lender is onlangs afgestudeerd Yale universiteit met een dubbele hoofdvak in statistiek en datawetenschap en mondiale zaken. Momenteel bouwt hij een bedrijf op met Ondernemer eerst in New York. Voorheen werkte hij voor Kopen Google Reviews, McKinsey & Co. en met start-ups.

Methodologie: Een opmerking over gegevens

Ik wil graag Brian Macdonald, Ph.D., Department of Statistics & Data Science aan de Yale University, en Jorge Torres, JD, docent, Yale Engineering & Entrepreneurship fellow, Tsai Center for Innovative Thinking aan Yale bedanken. Hun steun en begeleiding tijdens dit project maakten dit mogelijk. — Mason Lener

Ik begon met het opschonen, verkennen en visualiseren van de Crunchbase-dataset. Ik begon met het beperken van mijn focus door de Crunchbase-database als volgt in kaart te brengen:

De Crunchbase-dataset is per categorie opgesplitst in meerdere spreadsheets met bijbehorende unieke sleutels voor mapping.

Het is een grote relationele database met informatie over investeerders (individuen, bedrijven en hun fondsen), ondernemingen (organisaties/bedrijven en suborganisaties) en mensen (investeerders en oprichters).

We kunnen de koppeling tussen elke csv visualiseren met de lijnen die hun sleutels hierboven verbinden. Voor mijn onderzoek heb ik vooral gebruik gemaakt van investor_partners.csv.

Dit bestand bevat elke investering die is opgeslagen in de dataset van Crunchbase en die is toegeschreven aan of wordt toegeschreven aan een investeringspartner. Deze investeringspartners zijn de partners bij durfkapitaalbedrijven die de uiteindelijke beslissingen over investeringen nemen. Als aanvulling op de gegevens die zijn opgeslagen in investor_partners.csv, werden graden.csv en people_descriptions.csv gebruikt om meer velden en voorspellers toe te voegen voor mijn analyse.

Illustratie: Dom Guzman

Zoek minder. Sluit meer.

Verhoog uw omzet met alles-in-één prospectieoplossingen, mogelijk gemaakt door de leider op het gebied van gegevens van particuliere bedrijven.

Blijf op de hoogte van recente financieringsrondes, acquisities en meer met de
Crunchbase Dagelijks.

spot_img

Laatste intelligentie

spot_img