Zephyrnet-logo

Het data science-ecosysteem decoderen met Vikas Agrawal

Datum:

Ontdek de toekomst van AI met Dr. Vikas Agrawal, Senior Principal Data Scientist bij Oracle Analytics Cloud. In deze Leiden met datasessiedeelt hij inzichten over probleemoplossing in data science, MLops en de impact van generatieve AI op bedrijfsoplossingen. De discussie strekt zich uit van praktische benaderingen tot valkuilen in datawetenschapsprojecten en biedt essentieel advies voor aspirant-datawetenschappers.

[Ingesloten inhoud]

Belangrijkste inzichten uit ons gesprek met Vikas Agrawal

  • In de datawetenschap is de focus op het begrijpen van het probleem van cruciaal belang, omdat dit het grootste deel van de inspanning op zich neemt.
  • Een succesvolle Proof of Concept (POC) in data science moet niet alleen rekening houden met technische aspecten, maar ook met de bruikbaarheid en schaalbaarheid van de oplossing.
  • Duidelijke communicatie en het stellen van realistische verwachtingen aan klanten zijn van cruciaal belang om kostbare misverstanden als gevolg van de AI-hype te voorkomen.
  • Generatieve AI heeft het potentieel om bedrijfsoplossingen radicaal te veranderen, vooral op gebieden die verband houden met tekst en gebruikersinterfaces.
  • Het bouwen van een carrière in datawetenschap vereist een solide basis in wiskunde en een diep begrip van algoritmen.
  • In bedrijfsomgevingen vraagt ​​het waarborgen van de betrouwbaarheid van AI-outputs om nieuwe validatietechnieken.
  • Naarmate AI-tools evolueren, hebben datawetenschappers vaardigheden nodig om deze tools te verbeteren en te verbeteren, en niet alleen om ze te bedienen.

Bekijk meer van dergelijke inzichtelijke sessies met toonaangevende AI- en Data Science-experts op ons communitykanaal!

Hoe balanceer je technische diepgang met een macro-visie in data science?

In mijn dagelijkse werk heb ik veel te danken aan mijn mentoren van verschillende gewaardeerde instellingen en bedrijven die mij de filosofie hebben bijgebracht dat technologie een middel is om een ​​doel te bereiken, en niet het doel zelf. De sleutel is om een ​​aanzienlijke hoeveelheid tijd te besteden aan het begrijpen van het probleem; ongeveer 90% van de moeite gaat daarheen. De rest gaat over het vinden van oplossingen, waarbij vaak wordt gekeken naar hoe anderen soortgelijke problemen hebben benaderd en wat de klant uiteindelijk nodig heeft. Deze aanpak is van fundamenteel belang geweest bij het verbinden van technologie met zakelijke impact.

Wat is uw aanpak om het probleem van een klant op te lossen?

Zodra we een probleem hebben geïdentificeerd dat de moeite waard is om op te lossen, zorgen we er eerst voor dat we over de gegevens beschikken die nodig zijn om het probleem aan te pakken. Vervolgens beoordelen we of de technologie bestaat om het probleem binnen een redelijke termijn op te lossen. Als we een pad zien, ook al duurt het nog een paar jaar, gaan we verder met een proof of concept (POC). Deze POC is veelomvattend en omvat alles, van datapijplijnen tot end-to-end functionaliteit, hoewel schaalbaarheid in dit stadium niet de voornaamste zorg is. Het doel is om een ​​duidelijk pad te hebben naar de algoritmen, gegevensbronnen en de aard van de output waar we naar streven.

Hoe gaat u om met de optimalisatiefase en ML-operaties?

Na een succesvolle POC gaan we de optimalisatiefase in, waar het grootste deel van het werk ligt. Dit houdt in dat ervoor moet worden gezorgd dat het model zich aanpast aan verschillende bedrijfsprocessen en geografische gebieden, en zichzelf kan corrigeren wanneer het niet meer wordt verspreid. Het gaat er ook om ervoor te zorgen dat het model efficiënt kan worden omgeschoold en op de juiste manier kan worden geschaald. Deze fase is van cruciaal belang omdat het model daarin overgaat van een concept naar een praktische, inzetbare oplossing.

Wat zijn de meest voorkomende valkuilen bij data science-projecten?

De duurste fouten hebben meestal te maken met AI-hype en miscommunicatie. Het is cruciaal om duidelijke en wederzijdse verwachtingen te scheppen met de klant. Vaak hebben klanten hoge verwachtingen vanwege de buzz in de branche rond AI, waarbij ze zich niet realiseren dat de stand van de techniek niet altijd de juiste antwoorden biedt waarnaar ze op zoek zijn. Een andere valkuil is het verkeerd definiëren van het probleem, door het probleem van de klant niet rechtstreeks aan te pakken of door te proberen 'de oceaan te koken'.

Hoe gaat u om met generatieve AI in uw workflows?

Generatieve AI wordt in de meeste bedrijven niet veel gebruikt vanwege zorgen over auteursrechten en IP-besmetting. We maken echter wel gebruik van commercieel beschikbaar open source materiaal. Generatieve AI heeft aanzienlijke vooruitgang geboekt op het gebied van het samenvatten van teksten, het uitbreiden van tekst en het geven van uitleg. Betrouwbaarheid blijft een uitdaging en we onderzoeken technieken om de uitvoer van grote taalmodellen (LLM's) te filteren om ervoor te zorgen dat ze betrouwbaar zijn voor zakelijk gebruik.

Welke impact verwacht u dat generatieve AI zal hebben op bedrijfsoplossingen?

Generatieve AI zal waarschijnlijk de grootste impact hebben op workflows waarbij tekst wordt uitgevoerd, zoals het ophalen van informatie en gebruikersinterfaces. Het kan bijvoorbeeld enterprise search drastisch verbeteren door semantisch vergelijkbare stukken tekst op te halen. Het kan ook een revolutie teweegbrengen in natuurlijke taalinterfaces voor databases, waardoor gebruikers vragen in natuurlijke taal kunnen stellen en nauwkeurige SQL-antwoorden kunnen ontvangen.

Welk advies zou je geven aan degenen die vandaag de dag het data science-veld betreden?

Het is een opwindende tijd om in de datawetenschap te werken, maar het is van cruciaal belang om een ​​sterke basis in de wiskunde te hebben en de algoritmen waarmee je werkt te begrijpen. Naarmate AI-tools geavanceerder worden, zal het vermogen om deze uit te breiden en te verbeteren een waardevolle vaardigheid worden. Er zal veel vraag zijn naar degenen die nieuwe algoritmen kunnen creëren of de complexiteit van bestaande algoritmen kunnen begrijpen.

Samenvatting van het gesprek met Vikas Agrawal

In deze inzichtelijke sessie deelde Dr. Vikas Agrawal belangrijke inzichten voor succes in een carrière in de datawetenschap. Van het benadrukken van probleembegrip tot het navigeren door valkuilen en het omarmen van generatieve AI: het interview biedt een routekaart. Aspirant-datawetenschappers wordt geadviseerd een robuuste basis op te bouwen in wiskunde en algoritmen voor een vakgebied dat voortdurend in ontwikkeling is. Dit interview luidt een nieuw tijdperk van innovatie in AI in.

Blijf ons volgen Leidinggeven met data om op de hoogte te blijven van de reizen van meer van dergelijke pionierende AI- en Data Science-leiders in de sector. U kunt onze aankomende afrekenen Leidt hier met datasessies!

spot_img

Laatste intelligentie

spot_img