Dus zal AI onze jobs of niet?
Deze vraag doemt op, vooral na de enorme vooruitgang van AI en de lancering van verschillende tools (ChatGPT, Claude, Bard), waardoor debatten over het traject van automatisering en de impact ervan op de werkgelegenheid worden aangewakkerd.โ
Cognition, een in de VS gevestigde toepassing AI lab gericht op redeneren, geeft ons een kleine hint over de toekomst.
Maak kennis met Devin, 's werelds eerste volledig autonome AI software ingenieur.
Volgens Cognition: โDevin is een onvermoeibare, vaardige teammate, klaar om samen met u te bouwen of zelfstandig taken uit te voeren die u kunt beoordelen.โ
โMet Devin kunnen ingenieurs zich concentreren op interessantere problemen en engineering teamWe kunnen ambitieuzere doelen nastrevenโ, zegt het bedrijf.
Devin's vaardigheden: het uitvoeren van complexe taken tot het samenwerken met gebruikers
Cognitie zegt dat Devin complexe technische taken kan plannen en uitvoeren die duizenden beslissingen vereisen, zich bij elke stap de relevante context kan herinneren, in de loop van de tijd kan leren en fouten kan herstellen.
Devin beschikt over ontwikkelaarstools die een mens nodig heeft om zijn werk te doen, waaronder de shell, code-editor en browser in een sandbox-computeromgeving.
Dankzij de mogelijkheid om samen te werken kan Devin in realtime rapporteren over de voortgang, feedback accepteren en indien nodig met gebruikers samenwerken aan ontwerpkeuzes.
Om het eenvoudig te maken, hier is waar Devin toe in staat is:
- Leer nieuwe technologieรซn
- Bouw en implementeer apps van begin tot eind
- Kan zelfstandig bugs in codebases vinden en oplossen
- Kan zijn eigen AI-modellen trainen en verfijnen
- Los bugs en functieverzoeken op in open-sourcerepository's
- Draag bij aan volwassen productierepository's
Bovendien gaf het bedrijf Devin een echte baan bij het schrijven en debuggen van code voor Upwork om een โโcomputer vision-model uit te voeren.
In feite onderging Devin evaluatie op SWE-bench, een rigoureuze benchmark die agenten de opdracht geeft om echte GitHub-problemen aan te pakken die afkomstig zijn van open-sourceprojecten zoals Django en scikit-learn.
Devin behaalde een end-to-end resolutiepercentage van 13.86 procent, waarmee hij de eerdere state-of-the-art prestatie van 1.96 procent aanzienlijk overtrof.
Opvallend is dat eerdere toonaangevende modellen, zelfs als ze de precieze bestanden kregen om aan te passen, slechts 4.80 procent van de problemen konden aanpakken.
Wie is cognitie?
Gevestigd in New York en de San Francisco Bay Area, kennis heeft tot doel โAI teamvriendenโ met veel superieure capaciteiten. Het bedrijf heeft $21 miljoen opgehaald in een Series A-ronde onder leiding van het Founders Fund.
Het AI-bedrijf krijgt ook de steun van marktleiders, waaronder Patrick en John Collison, Elad Gil, Sarah Guo, Chris Re, Eric Glyman, Karim Atiyeh, Erik Bernhardsson, Tony Xu, Fred Ehrsam en anderen.