Ve světě IT existuje hodně stereotypů o programovacích jazycích - typu "PHP je nejhorší jazyk" nebo "Python je pro začátečníky". Díky projektu
eigencoder a analýze dat o vývojářích zjistíme, jaké vlastnosti korelují s jednotlivými programovacími jazyky.
Získání dat
Github je platforma, kterou jistě zná každý vývojář. Vedle své hlavní funkce coby repozitář pro verzování kódu umožňuje získat i statistiky o nejaktivnějších repozitářích a projektech, a tím pádem i o profilech tvůrců a vývojářů přispívajících do projektu (commiterů). Analýzou jejich profilů a avatarů se můžeme dostat k základním informacím jako je věk nebo pohlaví. K této analýze slouží Face API od Microsoftu - fotku obličeje dokáže klasifikovat na základě věku, výrazu a pohlaví.
Data
Github poskytuje seznam 25 momentálně nejpopulárnějších repozitářů a ukazuje 5 hlavních commiterů. Eigencoder aplikace detekuje pro repozitáře každého programovacího jazyka 30-80 tváří, které lze použít pro další analýzu.
Pohlaví
Jedna z vlastností, kterou dokáže Face API detekovat, je pohlaví. Výsledky jsou v tomto případě poněkud jednostranné.
Věk
Jak se ukázalo, věk je zajímavá metrika. Dalo by se čekat, že staré jazyky budou používány hlavně staršími programátory a mladší jazyky spíše mladší generací - vyšlo najevo, že i "staré" jazyky jako je Java nebo C používají i mladí programátoři.
Úsměv
Každý programátor má jazyky, ve kterých není zručný, píše kód jen obtížně a není mu zrovna do smíchu. A možná se pak nedokáže usmát ani pro svoji profilovou fotku. Face API vrací index od 0 do 1 jako aproximaci míry usměvavosti na fotce. Vypadá to, že nejveselejší jsou programátoři ve statistickém jazyce R. Následuje Go, C# a Python, kdežto nejsmutnější jsou podle profilových fotek na githubu Javisti.
Analýza mluvy vývojářů
Tobias Hermann analyzuje ve svém
projektu programátorské komunity a slovník, který používají při běžné komunikaci v komentářích a příspěvcích.
Štěstí
Nejpozitivnější mluvu najdete u vývojářů ve funkcionálních jazycích Clojure, Lisp a Scala.
Nadávky
Jednoznačně nejvíce nadávají vývojáři pracující v jazyce PHP, což asi nikoho nepřekvapí. Na druhé a třetí příčce je Javascript a Java. Nejkultivovanější se naopak zdají býti uživatelé matematických jazyků jako Mathematica, Haskell a Matlab.
Analýza dat nevykázala příliš vědecké výsledky, určitý obraz o programovacích jazycích ale podává. Jazyky PHP, HTML a R používají hlavně ženy, jazyky C a C++ pak skoro výhradně muži. Nejstarší vývojáře má jazyk C++, kdežto nejmladší jsou Javisti - ti jsou ale nejméně usměvaví. Co se usměvavosti týče u ostatních jazyků, tak absolutně nejlépe na tom jsou vývojáři v jazyce R, Go, C# a Python.
A jak jste na tom vy?
Jan Jileček