Data science i Python. Stawianie czoła najtrudniejszym wyzwaniom biznesowym Toruń

Data science to nieocenione wsparcie w rozwoju biznesu i działaniach mających na celu poprawę wyników finansowych firmy. Pomaga naukowcom lepiej obserwować i rozumieć otaczający ich świat. Bywa też źródłem świetnej zabawy. Jako analityk danych staniesz się częścią branży, która ciągle rośnie i się …

od 39,75 Najbliżej: 2,4 km

Liczba ofert: 8

Oferta sklepu

Opis

Data science to nieocenione wsparcie w rozwoju biznesu i działaniach mających na celu poprawę wyników finansowych firmy. Pomaga naukowcom lepiej obserwować i rozumieć otaczający ich świat. Bywa też źródłem świetnej zabawy. Jako analityk danych staniesz się częścią branży, która ciągle rośnie i się rozwija, a to znaczy, że wyzwania, jakie napotkasz, będą coraz ciekawsze i bardziej ekscytujące. Musisz się tylko nauczyć pracować z danymi. Dzięki tej książce dowiesz się, jak pozyskiwać, analizować i wizualizować dane, a potem używać ich do rozwiązywania problemów biznesowych. Wystarczy, że znasz podstawy Pythona i matematyki na poziomie liceum, aby zacząć stosować naukę o danych w codziennej pracy. Znajdziesz tu szereg praktycznych i zrozumiałych przykładów: od usprawniania działalności wypożyczalni rowerów, poprzez wyodrębnianie danych z witryn internetowych, po budowę systemów rekomendacyjnych. Poznasz rozwiązania oparte na danych, przydatne w podejmowaniu decyzji biznesowych. Nauczysz się korzystać z eksploracyjnej analizy danych, przeprowadzać testy A/B i klasyfikację binarną, a także używać algorytmów uczenia maszynowego. Sprawdź, jak w prosty sposób: prognozować popyt optymalizować kampanie marketingowe ograniczać odpływ klientów przewidywać ruch w witrynie internetowej budować systemy rekomendacyjne Data science dla biznesu: czarna magia? Nie z Pythonem! Spis treści: Podziękowania Wprowadzenie 1. Eksploracyjna analiza danych Twój pierwszy dzień na stanowisku prezesa Znajdowanie wzorców w zbiorach danych Używanie plików .csv do przeglądania i przechowywania danych Wyświetlanie danych w Pythonie Obliczanie statystyk zbiorczych Analizowanie podzbiorów danych Dane nocne Dane sezonowe Wizualizacja danych za pomocą Matplotlib Rysowanie i wyświetlanie prostego wykresu Tytuły i etykiety na wykresach Kreślenie podzbiorów danych Testowanie różnych typów wykresów Eksplorowanie korelacji Obliczanie korelacji Silna i słaba korelacja Znajdowanie korelacji między zmiennymi Tworzenie map cieplnych Dalsza eksploracja Podsumowanie 2. Prognozowanie Przewidywanie popytu Oczyszczanie błędnych danych Kreślenie danych w celu odkrywania trendów Przeprowadzanie regresji liniowej Algebraiczne podstawy linii regresji Obliczanie miar błędu Używanie regresji do prognozowania przyszłych trendów Wypróbowywanie innych modeli regresji Przewidywanie sprzedaży z wykorzystaniem multiwariantnej regresji liniowej Oddawanie zmienności z wykorzystaniem trygonometrii Wybieranie najlepszej regresji na potrzeby prognozowania Dalsza eksploracja Podsumowanie 3. Porównywanie grup Dane dotyczące populacji Statystyki zbiorcze Próby losowe Różnice między próbami Testowanie hipotez Test t Niuanse testowania hipotez Porównywanie grup w kontekście praktycznym Podsumowanie 4. Testy A/B Potrzeba eksperymentowania Przeprowadzanie eksperymentów w celu testowania nowych hipotez Matematyka testów A/B Przekładanie matematyki na praktykę Optymalizacja z wykorzystaniem modelu mistrz - pretendent Zapobieganie pomyłkom z wykorzystaniem prawa Twymana i testów A/A Wielkości efektu Obliczanie istotności danych Zastosowania i kwestie zaawansowane Etyka testów A/B Podsumowanie 5. Klasyfikacja binarna Minimalizowanie odpływu klientów Używanie liniowych modeli prawdopodobieństwa do znajdowania klientów wysokiego ryzyka Wykres ryzyka odpływu Potwierdzanie zależności za pomocą regresji liniowej Przewidywanie przyszłości Dokonywanie rekomendacji biznesowych Mierzenie dokładności prognoz Multiwariantne modele LPM Tworzenie nowych miar Wady modeli LPM Przewidywanie binarnych wyników za pomocą regresji logistycznej Rysowanie krzywych logistycznych Dopasowywanie krzywej logistycznej do danych Zastosowania klasyfikacji binarnej Podsumowanie 6. Uczenie nadzorowane Przewidywanie ruchu w witrynie internetowej Wczytywanie i wykreślanie danych dotyczących artykułów Używanie regresji liniowej jako metody przewidywania Uczenie nadzorowane Metoda k najbliższych sąsiadów Implementowanie metody k-NN Analiza k-NN z wykorzystaniem pakietu sklearn Używanie innych algorytmów uczenia nadzorowanego Drzewa decyzyjne Lasy losowe Sieci neuronowe Mierzenie dokładności prognoz Praca z modelami multiwariantnymi Używanie klasyfikacji zamiast regresji Podsumowanie 7. Uczenie nienadzorowane Uczenie nadzorowane a uczenie nienadzorowane Generowanie i eksplorowanie danych Rzucanie kością Używanie innego typu kości Określanie źródła obserwacji przez klasteryzację Klasteryzacja w zastosowaniach biznesowych Analizowanie wielu wymiarów Klasteryzacja E-M Etap zgadywania Etap oczekiwań Etap maksymalizacji Etap konwergencji Inne metody klasteryzacji Inne metody uczenia nienadzorowanego Podsumowanie 8. Web scraping Jak działają witryny internetowe? Twój pierwszy scraper Parsowanie kodu HTML Scraping adresów e-mail Bezpośrednie wyszukiwanie adresów Wyrażenia regularne Używanie metaznaków do elastycznych wyszukiwań Dostrajanie wyszukiwań z wykorzystaniem sekwencji unikowych Łączenie metaznaków w wyszukiwaniach zaawansowanych Używanie wyrażeń regularnych do wyszukiwania adresów e-mail Przekształcanie wyników w użyteczne dane Używanie biblioteki Beautiful Soup Parsowanie elementów etykiety HTML Scraping i parsowanie tabel HTML Zaawansowany scraping Podsumowanie 9. Systemy rekomendacyjne Rekomendacje oparte na popularności Filtrowanie kolaboratywne oparte na artykułach Mierzenie podobieństwa wektorów Obliczanie podobieństwa kosinusowego Implementowanie filtrowania kolaboratywnego opartego na artykułach Filtrowanie kolaboratywne oparte na użytkownikach Studium przypadku: rekomendacje muzyczne Generowanie rekomendacji za pomocą zaawansowanych systemów Podsumowanie 10. Przetwarzanie języka naturalnego Używanie NLP do wykrywania plagiatów Model NLP word2vec Ocenianie podobieństw między słowami Tworzenie układu równań Analizowanie wektorów liczbowych w word2vec Manipulowanie wektorami poprzez obliczenia matematyczne Wykrywanie plagiatów z wykorzystaniem word2vec Model skip-thoughts Modelowanie tematyczne Inne zastosowania NLP Podsumowanie 11. Data science w innych językach Wygrywanie meczów piłkarskich z pomocą SQL-a Wczytywanie i analizowanie danych Podstawy SQL-a Tworzenie bazy danych SQL Wykonywanie kwerend SQL Łączenie danych poprzez łączenie tabel Wygrywanie meczów piłkarskich z pomocą języka R Podstawy języka R Stosowanie regresji liniowej w języku R Kreślenie danych w R Inne przydatne umiejętności Podsumowanie Skorowidz O autorze: Dr Bradford Tuckfield jest analitykiem danych, konsultantem i autorem książek. Publikował artykuły z zakresu matematyki, zarządzania i medycyny w wielu renomowanych czasopismach. Kieruje założoną przez siebie firmą konsultingową Kmbara. Zajmował się też kulturą i polityką publiczną.

Specyfikacja

Podstawowe informacje

Autor
  • Bradford Tuckfield
Wybrane wydawnictwa
  • Helion
Okładka
  • Miękka
Rok wydania
  • 2024
Ilość stron
  • 280
Tematyka
  • Projektowanie
ISBN
  • 9788328910140