Dziś mamy dla Was dość nietypową propozycję. Jak wiecie, astronomia to nie tylko patrzenie w gwiazdy i szukanie gwiazdozbiorów. To także analiza ogromnych zbiorów danych. W internecie znajduje się wiele baz danych poświęcone astronomii. Możemy w nich znaleźć informacje o obiektach kosmicznych, ich własnościach oraz wykonanych obserwacjach astronomicznych.

Sama analityka danych jest uważana za wyjątkowo obiecującą dziedzinę wiedzy. Rozwija się błyskawicznie i znajduje coraz to nowsze zastosowania. Dziś wszyscy korzystamy ze smartfonów, laptopów i innych urządzeń z dostępem do internetu, zatem ilość wszystkich zgromadzonych danych rośnie w niesamowitym tempie. W przypadku tak specyficznej dziedziny, jaką jest nauka o danych, szczególnie istotne jest zdobycie gruntownych podstaw i dogłębne ich zrozumienie.

The Ohio State University

W tym przewodniku opisano zagadnienia związane z podstawami nauki o danych. Wyjaśniono niezbędne elementy matematyki i statystyki. Przedstawiono także techniki budowy potrzebnych narzędzi i sposoby działania najistotniejszych algorytmów. Książka została skonstruowana tak, aby poszczególne implementacje były jak najbardziej przejrzyste i zrozumiałe. Zamieszczone tu przykłady napisano w Pythonie: jest to język dość łatwy do nauki, a pracę na danych ułatwia szereg przydatnych bibliotek Pythona. W drugim wydaniu znalazły się nowe tematy, takie jak uczenie głębokie, statystyka i przetwarzanie języka naturalnego, a także działania na ogromnych zbiorach danych. Zagadnienia te często pojawiają się w pracy współczesnego analityka danych.

Dzisiejszy bałagan nadmiaru danych zawiera odpowiedzi na pytania, o których nikt nawet nie pomyślał. Ta książka zawiera wiedzę pozwalającą „wykopać” te odpowiedzi. Autor książki, Joel Grus, pomaga zaznajomić się ze statystykami i matematyką, które stanowią rdzeń wszelkich projektów związanych z nauką danych. Sam jest inżynierem oprogramowania, analitykiem danych i autorem świetnie sprzedających się książek. Obecnie zajmuje się pracą badawczą w Allen Institute for Artificial Intelligence w Seattle. Wcześniej był zatrudniony w firmie Google i kilku startupach. Mieszka w Seattle, gdzie regularnie uczestniczy w spotkaniach lokalnej społeczności analityków danych.

Najlepszą rzeczą w tej książce jest jej bardzo dobrze napisana treść, która obejmuje również szeroki zakres tematów związanych z uczeniem maszynowym i nauką o danych. Niewiele rozdziałów, które szczególnie rzucają się w oczy, to sekcja wprowadzająca lub odświeżająca Pythona, prawdopodobieństwo i statystyka, objaśnienie technik uczenia maszynowego i metody manipulacji danymi. Autor zebrał sporą ilość teorii i wskazówek, które czytelnicy mogą wykorzystać do dalszego czytania. Łatwe do wykonania kroki budowania algorytmów z pewnością przyciągną uwagę czytelnika. Jednak chociaż autor uchwycił wszystkie koncepcje i pomysły zawarte w książce, byłoby jeszcze lepiej, gdyby zostały one przedstawione w bardziej uporządkowany sposób. Czasem miałam wrażenie, że autor ogranicza wyjaśnienia. Na przykład opis odchylenia standardowego zajmuje jeden wiersz w sekcji Statystyka.

Podsumowując, „Data science od podstaw. Analiza danych w Pythonie” jest dobrym źródłem dla naukowców zajmujących się danymi. Pozwala uporządkować i zaktualizować wiedzę. A co z osobami, które wcześniej nie miały do czynienia z programowaniem czy statystyką? Myślę, że jednak na początku powinny sięgnąć po podręcznik z podstaw Pythona, wtedy o wiele łatwiej i szybciej wchłoną wiedzę z książki.

Jeśli zainteresowała Was ta lektura i chcecie rozpocząć swoją przygodę z data science albo odświeżyć swoją wiedzę na ten temat serdecznie zapraszamy na stronę księgarni Helion, gdzie możecie także zobaczyć pełny spis treści.

Tytuł oryginalny: Data Science from Scratch: First Principles with Python, 2nd Edition
Autor: Joel Grus
Wydawca: Wydawnictwo Helion
Stron: 352
Data wydania: 20 lutego 2020

Autor

Avatar photo
Julia Liszniańska

Była redaktor naczelna AstroNETu i członek Klubu Astronomicznego Almukantarat. Studentka informatyki na Politechnice Wrocławskiej. Stypendystka m.in. programów: TopMinds organizowanego przez Polsko-Amerykańską Komisję Fulbrighta, Microsoft Career Club oraz G4G Nokia.