6-DHLBigData (1).pdf - DUŻE DANE W LOGISTYCE A DHL. To jest koniec podglądu. Zarejestruj się, aby uzyskać dostęp do reszty dokumentu. Niesformatowany podgląd tekstu: DUŻE DANE W LOGISTYCE Perspektywa DHL na temat wyjścia poza szum reklamowy Grudzień 2017 Zasilany przez rozwiązania amp Innowacje: Badania trendów PUBLISHER DHL Rozwiązania dla klientów amp Innowacje reprezentowane przez Martina Wegnera Wiceprezes Rozwiązania amp Innowacja 53844 Troisdorf, Niemcy PROJECT DIRECTOR Dr Markus Kckelhaus Solutions amp Innowacje, DHL ZARZĄDZANIE PROJEKTAMI I BIURO EDYTORIALNE Katrin Zeiler Rozwiązania amp Innowacja, DHL WSPÓŁPRACA Z: AUTORZY Martin Jeske, Moritz Grner, Frank Wei Przedmowa PRZEDMOWA Big Data i logistyka są stworzone dla siebie nawzajem, a dziś w branży logistycznej stara się wykorzystać to bogactwo informacji do lepszego wykorzystania. Potencjał Big Data w branży logistycznej został już podkreślony w uznanym przez DHL Logistics Trend Radar. To nadrzędne opracowanie jest dynamicznym, żywym dokumentem mającym pomóc organizacjom w opracowaniu nowych strategii i opracowaniu bardziej zaawansowanych projektów i innowacji. Big Data ma wiele do zaoferowania światowi logistyki. Zaawansowana analiza danych może skonsolidować ten tradycyjnie rozdrobniony sektor, a te nowe możliwości sprawiają, że dostawcy logistyczni są w czołówce jako wyszukiwarki w świecie fizycznym. Został opracowany wspólnie z T-Systems i ekspertami z Detecon Consulting. Zespół badawczy połączył światowe doświadczenie zarówno z dziedziny logistyki, jak iz domeny zarządzania informacją. Możemy przenieść się z głębokiej studni danych do głębokiej eksploatacji Mamy nadzieję, że Big Data in Logistics dostarczy Ci nowych, potężnych perspektyw i pomysłów. Dziękujemy, że zdecydowaliście się przyłączyć do wspólnej podróży Big Data. Wszyscy możemy skorzystać z nowego modelu współpracy i współpracy w branży logistycznej. W jaki sposób możemy wykorzystać informacje, aby poprawić efektywność operacyjną i zadowolenie klienta, a także stworzyć użyteczne nowe modele biznesowe? Z poważaniem. Aby zwiększyć ostrość, raport trendów, który czytasz, zadaje teraz kluczowe pytania dotyczące Big Data: Big Data to stosunkowo niewykorzystany zasób, który firmy mogą wykorzystać, gdy przyjmą zmianę mentalności i zastosują odpowiednie techniki wiercenia. Wykracza to poza słowa buzzów, oferując rzeczywiste przypadki użycia, ujawniając co się teraz dzieje i co może się wydarzyć w przyszłości. Ten raport trendów rozpoczyna się od wprowadzenia do koncepcji i znaczenia Big Data, dostarcza przykładów zaczerpniętych z wielu różnych branż, a następnie przedstawia przypadki użycia logistyki. Martin Wegner Dr Markus Kckelhaus 1 2 Spis treści Przedmowa. 1 1 Zrozumienie dużych zbiorów danych. 3 2 Najlepsze praktyki dotyczące najlepszych danych w różnych branżach. 6 2.1 Wydajność operacyjna. 7 2.2. Doświadczenie klienta. 10 2.3 Nowe modele biznesowe. 13 3 Big Data w logistyce. 15 3.1 Logistyka jako biznes oparty na danych. 15 3.2 Sprawność użytkowa spraw. 18 3.3 Użytkowanie spraw Klientów. 22 3.4 Wykorzystanie przypadków Nowe modele biznesowe. 25 3.5 Czynniki sukcesu w implementacji Big Data Analytics. 27 Outlook. 29 Zrozumienie dużych zbiorów danych 1 ZROZUMIENIE DUŻYCH DANYCH Trwały sukces sieciowych potęg, takich jak Amazon, Google, Facebook i eBay, dostarcza dowodów na czwarty czynnik produkcji w dzisiejszym, hiperłączonym świecie. Oprócz zasobów, pracy i kapitału, nie ma wątpliwości, że informacja stała się niezbędna we wszechświecie1, dzięki rozwojowi mediów społecznościowych, wszechobecnemu dostępowi do sieci i stale rosnącej liczbie inteligentnych urządzeń połączonych. Współczesny cyfrowy wszechświat rozwija się z szybkością podwajającą objętość danych co dwa lata2 (patrz rysunek 1). element konkurencyjnego różnicowania. Firmy w każdym sektorze starają się wymieniać emocje, aby uzyskać dokładny, oparty na danych wgląd w celu osiągnięcia skutecznego podejmowania decyzji biznesowych. Bez względu na to, jaką kwestię należy podjąć, oczekiwane wielkości sprzedaży, preferencje dotyczące produktów klientów, zoptymalizowane harmonogramy pracy, dane są teraz w stanie pomóc firmom odnieść sukces. Podobnie jak poszukiwanie ropy naftowej, dzięki Big Data wymaga wykształconych wierceń, aby odkryć wiele cennych informacji. Dlaczego tak istotne jest poszukiwanie istotnych informacji? Z powodu ogromnego wzrostu dostępnych danych wewnątrz firm i publicznego Internetu. W 2008 roku liczba dostępnych cyfrowych informacji (bitów) przewyższała liczbę gwiazd Oprócz tego wykładniczego wzrostu wolumenu, dwie dalsze charakterystyki danych znacznie się zmieniły. Po pierwsze dane napływają. Ogromne wdrożenie podłączonych urządzeń, takich jak samochody, smartfony, czytniki RFID, kamery internetowe i sieci czujników, zapewnia ogromną liczbę autonomicznych źródeł danych. Urządzenia takie jak te nieprzerwanie generują strumienie danych bez interwencji człowieka, zwiększając prędkość agregacji danych i przetwarzania. Po drugie, dane są niezwykle różnorodne. Zdecydowana większość nowo tworzonych danych pochodzi z obrazów z kamer, materiałów wideo i monitoringu, wpisów w blogu, dyskusji na forum i katalogów e-commerce. Wszystkie te niestrukturalne źródła danych przyczyniają się do znacznie większej różnorodności typów danych. 40 000 30 000 (ekwiwalenty) 20 000 10.000 2009 2017 2017 2017 2017 2017 2018 2018 2017 2018 2019 2020 Rysunek 1: Wzrost wykładniczy danych w latach 2017 i 2020 Źródło: Badanie Digital Universe IDC, sponsorowane przez EMC, grudzień 2017 The Diverse and Exploding Digital Universe, IDC , 2008 1 Cyfrowy wszechświat w roku 2020: Big Data, większe cyfrowe cienie i największy wzrost na Dalekim Wschodzie, IDC, sponsorowany przez EMC, grudzień 2017 2 3 4 Zrozumienie dużych danych Telefonica musiała odpowiedzieć w trakcie podróży, aby w końcu wypromować Smart Usługa krokowa była następująca: Jaką dodatkową wartość ma ta większość danych i jak możemy z niej skorzystać? Konsumenci znają się na podejmowaniu codziennych decyzji, takich jak zakupy, planowanie trasy lub znajdowanie miejsca do jedzenia, ale firmy pozostają w tyle . Aby wykorzystać swoje zasoby informacyjne, firmy muszą przede wszystkim zmienić swoje nastawienie do korzystania z danych. W przeszłości wykorzystywano analitykę danych do potwierdzania decyzji, które już zostały podjęte. Wymagana jest zmiana kulturowa. Firmy muszą przejść na wybiegający w przyszłość styl analizy danych, który generuje nowy wgląd i lepsze odpowiedzi. Ta zmiana mentalności oznacza również nową jakość eksperymentowania, współpracy i przejrzystości w całej firmie. Objętość, prędkość i różnorodność (3V) to te wielkie dane W literaturze 3V były szeroko omawiane jako cechy analizy Big Data. Ale jest znacznie więcej do rozważenia, jeśli firmy chcą wykorzystać informacje jako czynnik produkcji i wzmocnić swoją pozycję konkurencyjną. Niezbędna jest zmiana sposobu myślenia i zastosowanie właściwych technik wiercenia. Stać się biznesem opartym na informacjach Gdy globalny dostawca usług telekomunikacyjnych Telefonica zaczął badać modele biznesowe oparte na informacjach, firma była już w stanie przetwarzać setki milionów rekordów danych z sieci komórkowej każdego dnia w celu trasowania i fakturowania połączeń telefonicznych i usług transmisji danych. . Dlatego obsługa dużej ilości danych przy dużej prędkości nie była głównym problemem. Zamiast tego kluczowe pytanie Wraz z tym przejściem, kolejnym warunkiem wstępnym do zostania firmą opartą na informacjach jest ustanowienie określonego zestawu umiejętności związanych z danymi. Obejmuje to opanowanie zarówno szerokiego spektrum procedur analitycznych, jak i pełne zrozumienie biznesu. Firmy muszą przyjąć nowe podejście technologiczne, aby eksplorować informacje w większej kolejności i szybciej. Destrukcyjne paradygmaty przetwarzania danych, takie jak bazy danych w pamięci i ostatecznie spójne modele obliczeniowe, mogą rozwiązać problemy analizy danych na dużą skalę przy ekonomicznie opłacalnym koszcie. Każda firma ma już wiele informacji. Jednak większość ich danych musi zostać dopracowana tylko wtedy, gdy może zostać przekształcona w wartość biznesową. Dzięki analizom Big Data przedsiębiorstwa mogą osiągnąć postawę, umiejętności i technologię wymaganą, aby stać się rafinerią danych i stworzyć dodatkową wartość z ich zasobów informacyjnych. Zrozumienie logistyki Big Data i Big Data to doskonałe dopasowanie Sektor logistyczny jest idealnie przygotowany do korzystania z technologicznych i metodologicznych osiągnięć Big Data. Silną wskazówką, że mistrzostwo w danych zawsze było kluczem do dyscypliny, jest to, że w starożytnych greckich korzeniach logistyka oznacza praktyczną arytmetykę. Dzisiaj operatorzy logistyczni zarządzają ogromnym przepływem towarów, a jednocześnie tworzą ogromne zbiory danych. W przypadku milionów przesyłek każdego dnia pochodzenie i miejsce docelowe, rozmiar, waga, zawartość i lokalizacja są śledzone w globalnych sieciach dostawczych. Ale czy to śledzenie danych w pełni wykorzystuje wartość? Prawdopodobnie nie. Najprawdopodobniej istnieje ogromny niewykorzystany potencjał poprawy wydajności operacyjnej i doświadczenia klientów oraz tworzenia przydatnych nowych modeli biznesowych. Rozważmy na przykład korzyści płynące z integracji strumieni danych w łańcuchu dostaw od wielu dostawców usług logistycznych, co może wyeliminować obecną fragmentację rynku, umożliwiając nową, potężną współpracę i usługi. Wielu dostawców zdaje sobie sprawę, że Big Data to trend zmieniający dynamikę w branży logistycznej. W ostatnim badaniu dotyczącym trendów w łańcuchu dostaw sześćdziesiąt procent respondentów stwierdziło, że planuje zainwestować w analitykę Big Data w ciągu najbliższych pięciu lat4 (zob. Wykres 2 poniżej). Jednak poszukiwanie przewagi konkurencyjnej rozpoczyna się od identyfikacji silnych przypadków użycia Big Data. W tym artykule najpierw przyglądamy się organizacjom, które pomyślnie wdrożyły analitykę Big Data w kontekście własnych branż. Następnie przedstawiamy kilka przypadków użycia specyficznych dla sektora logistyki. Sieci społecznościowe (wewnętrzne, B2B) Platformy analizy biznesowej jako usługa Dzisiaj Sieć pięcioletnia Redesign SoftwareSystems Zarządzanie cyklem życia produktu 0 10 20 30 40 50 60 70 Rysunek 2: Obecne i planowane obszary inwestycyjne dla technologii Big Data. Źródło: Trendy i strategie w logistyce i zarządzaniu łańcuchem dostaw, s. 51, BVL International, 2017 Definicja i rozwój, Logistik Baden-Wrttemberg, cf. logistik-bw. deDefinition.411M52087573ab0.0.html 3 Trendy i strategie w logistyce i zarządzaniu łańcuchem dostaw, BVL International, 2017 4 5 6 Big Data Najlepsze praktyki w różnych branżach 2 DUŻE DANE NAJLEPSZA PRAKTYKA W BRANŻOWYCH BRANŻACH Wykorzystanie wartości aktywów informacyjnych nowy cel strategiczny dla większości przedsiębiorstw i organizacji. Oprócz internetowych potęg, które z powodzeniem ustanowiły modele biznesowe oparte na informacjach, firmy z innych sektorów są zazwyczaj na wczesnym etapie odkrywania, jak korzystać z rosnącego sterty danych i dobrze wykorzystują te dane. Zgodnie z ostatnimi badaniami5 tylko 14 europejskich firm już teraz analizuje dane Big Data w ramach ich planowania strategicznego (zob. Rysunek 3). A jednak prawie połowa z tych firm spodziewa się rocznego przyrostu danych w swojej organizacji ponad 25. Pierwsza i najbardziej oczywista jest efektywność operacyjna. W tym przypadku dane są wykorzystywane do podejmowania lepszych decyzji, optymalizacji zużycia zasobów oraz poprawy jakości i wydajności procesu. To, co zawsze zapewniało automatyczne przetwarzanie danych, ale z rozszerzonym zestawem możliwości. Drugi wymiar to doświadczenie klienta. Typowymi celami są: zwiększenie lojalności klientów, precyzyjna segmentacja klientów i optymalizacja obsługi klienta. Włączając ogromne zasoby danych publicznego Internetu, Big Data przenosi techniki CRM na kolejny etap ewolucyjny. Umożliwia także nowe modele biznesowe, które uzupełniają strumienie przychodów z istniejących produktów i generują dodatkowe przychody z całkowicie nowych produktów (danych). Wielkości dużych danych Kiedy firmy przyjmują Big Data w ramach swojej strategii biznesowej, pierwsze pytanie, jakie należy zadać, to zazwyczaj rodzaj wartości, jaką Big Data będzie napędzać Czy przyczyni się do osiągnięcia najwyższej lub najniższej wartości, czy też pojawi się niefinansowy sterownik Z punktu widzenia wartości zastosowanie analityki Big Data mieści się w jednym z trzech wymiarów (patrz Rysunek 4). Dla każdego z tych wymiarów wartości Big Data rośnie liczba atrakcyjnych aplikacji. Prezentują one potencjał biznesowy polegający na zarabianiu informacji na szerokim spektrum rynków pionowych. W następnych sekcjach przedstawiamy kilka przykładów użycia, aby zilustrować, w jaki sposób wcześni eksporterzy wykorzystali źródła danych w innowacyjny sposób, iw konsekwencji stworzyli istotną dodatkową wartość. Czy Twoja firma określiła strategię Big Data Czy Twoja firma określiła strategię Big Data nr 63 23 Planowane tak 14 Rysunek 3: Big Data jako cel strategiczny w firmach europejskich Statystyki z badania BARC (N 273) Źródło: Big Data Survey Europe, BARC , Luty 2017, s. 17 Badanie dużych danych w Europie, Instytut BARC, luty 2017 r. 5 Najlepsze praktyki w zakresie dużych danych w różnych branżach Wydajność operacyjna w zakresie obsługi klienta Zużycie klienta Wykorzystanie danych w celu: Wykorzystania danych Wykorzystanie: Wykorzystywanie danych dotyczących: Zwiększenie liczby klientów Zwiększenie lojalności klientów i zachowanie retencji Wykonywanie precyzyjnych Wykonywanie klientów precyzyjne segmentowanie i kierowanie na segmentację i kierowanie Optymalizuj klienta Optymalizuj interakcję interakcje klienci, usługi i usługi Efektywność Zwiększ poziom Zwiększ poziom przezroczystości przezroczystości Optymalizuj zasoby Optymalizuj zużycie Konsumpcja zasobów Zwiększ jakość procesu Zużycie i wydajność Poprawa jakość i wydajność procesu Ex perience Nowe modele Nowe modele biznesowe Capitalize ondata databy: by: wykorzystać rozszerzanie źródeł przychodów Rozszerzanie źródeł przychodów z istniejących produktów z istniejących produktów Tworzenie nowych przychodów z przychodu Tworzenie nowych strumieni z całkowicie strumieni z zupełnie nowych produktów (danych) produktów (danych) Rysunek 4: Wielkości wartości dla przypadków użycia Big Data Źródło: DPDHL Detecon 2.1 Wydajność operacyjna 2.1.1 Wykorzystanie danych do przewidywania punktów krytycznych przestępczości W przypadku metropolitalnych departamentów policji zadanie tropienia przestępców w celu zachowania bezpieczeństwa publicznego może czasami być uciążliwe. W przypadku wielu ukrytych repozytoriów informacji, praca grupowa często wiąże się z ręcznym połączeniem wielu punktów danych. To wymaga czasu i dramatycznie spowalnia rozpatrywanie sprawy. Ponadto zasoby policji drogowej są rozmieszczane w sposób reaktywny, co utrudnia łapanie przestępców na gorącym uczynku. W większości przypadków nie można rozwiązać tych problemów, zwiększając liczbę personelu policji, ponieważ budżety publiczne są ograniczone. Jednym z organów, który wykorzystuje różne źródła danych, jest nowojorski Departament Policji (NYPD). Poprzez przechwytywanie i łączenie informacji związanych z przestępczością, ma nadzieję pozostać o krok przed sprawcami przestępstw6. Na długo przed powstaniem terminu Big Data, NYPD podjęło wysiłek rozbicia podziału swoich danych na dane (np. dane z 911 połączeń, raportów z badań i innych). Dzięki jednemu spojrzeniu na wszystkie informacje związane z jednym przestępstwem funkcjonariusze uzyskują bardziej spójny obraz swoich spraw w czasie rzeczywistym. Ta zmiana znacznie przyspieszyła analizę retrospektywną i umożliwia NYPD podjęcie działań wcześniej w śledzeniu poszczególnych przestępców. Stale spadające wskaźniki przestępstw z użyciem przemocy w Nowym Jorku7 przypisano nie tylko skuteczniejszemu upraszczaniu wielu danych wymaganych do prowadzenia spraw, ale także zasadniczej zmianie w praktyce policyjnej.8 Poprzez wprowadzenie analizy statystycznej i mapowania geograficznego miejsc przestępczych , NYPD był w stanie stworzyć szerszy obraz, aby kierować wdrażaniem zasobów i praktyką patrolowania. Teraz wydział rozpoznaje wzorce przestępczości za pomocą analizy obliczeniowej, co dostarcza informacji umożliwiających każdemu oficerowi dowodzenia proaktywną identyfikację gorących punktów działalności przestępczej. NYPD zmienia równanie kontroli przestępczości przez sposób, w jaki wykorzystuje informacje, IBM cf. www-01.ibmsoftwaresuccesscssdb. nsfCSJSTS-6PFJAZ 6 Zbrodnie indeksowe według regionu, Wydział ds. Sprawiedliwości w Sądzie Karnym w Nowym Jorku, maj 2017 r., zob. criminaljustice. ny. govcrimnetojsastats. htm 7 Compstat i zmiany organizacyjne w Departamencie Policji Lowell, Willis i in. glin. Police Foundation, 2004 cf. policefoundation. org 8 contentcompstat-and-organization-change-lowell-police-department 7 8 Najlepsze praktyki w zakresie najlepszych danych w różnych branżach Ta przewidywana perspektywa stawia NYPD w pozycji umożliwiającej skuteczne ukierunkowanie na rozmieszczenie zasobów ludzkich i zasobów. W połączeniu z innymi środkami systematyczna analiza istniejących informacji przyczyniła się do stałego spadku liczby przestępstw z użyciem przemocy (zob. Wykres 5). Technika wykorzystywania danych historycznych do rozpoznawania wzorców, a tym samym przewidywania miejsc przestępstw, została z czasem przyjęta przez wiele gmin w USA. Coraz więcej departamentów policji oferuje informacje kryminalne społeczeństwu, strony trzecie również zaczęły przewidują przewidywania miejsca zbrodni, łączą dane w widoku krajowym, a także zapewniają anonimową funkcję przechylania (patrz rys. 6) .9 26.000 1.000 24.000 -3 900 22.000 800 20.000 700 18.000 -4 600 Napad 16.000 500 14.000 400 12.000 300 10.000 2002 Zabójstwo 2004 2006 2008 2017 r. 2017 r. Rysunek 5: Rozwój brutalnych przestępstw w Nowym Jorku dane zaczerpnięte z przestępstw na podstawie indeksów zgłoszonych policji według regionu: Nowy Jork, 20032017, Źródło: Departament ds. Usług karnych w stanie Nowy Jork, zob. criminaljustice. ny. govcrimnetojsastats. htm Rysunek 6: Publiczny zrzut ekranu silników Crimereports, cf. crimereport Cf. publishing (przykładowe) 9 Big Data Best Practice Across Industries 2.1.2 Optymalne planowanie zmian w sklepach detalicznych Dla menadżerów sklepów detalicznych planowanie zmian w celu sprostania wymaganiom klientów jest delikatnym zadaniem. Nadmierne zatłoczenie sklepu powoduje niepotrzebne wydatki i obniża rentowność witryny. Prowadzenie sklepu z niskim poziomem personelu negatywnie wpływa na zadowolenie klientów i pracowników. Oba są złe dla biznesu. W DM drogeriach zadanie planowania zmian było historycznie wykonywane przez kierownika sklepu w oparciu o proste ekstrapolacje i osobiste doświadczenia. W przypadku zwykłych dni roboczych proces ten był wystarczająco dobry. Ale wraz z rosnącą liczbą wyjątków, stała się niezadowalająca. Nadmiar lub niedobór personelu ograniczał wydajność sklepu. DM postanowił więc skutecznie wspierać menedżerów sklepów w ich planowaniu personalnym, szukając sposobów na rzetelne prognozowanie popytu w każdym punkcie sprzedaży.10 Podejście polegało na wdrożeniu długoterminowej prognozy przychodów dziennych sklepów, biorąc pod uwagę szeroki zakres indywidualne i lokalne parametry. Dane wejściowe do nowego algorytmu zawierały historyczne dane o przychodach, godziny otwarcia oraz czasy nadejścia nowych towarów z centrów dystrybucyjnych. Ponadto, inne dane zostały spożytkowane, aby osiągnąć najwyższy poziom precyzji. Dane te obejmowały lokalne uwarunkowania, takie jak dni targowe, święta w sąsiednich lokalizacjach, objazdy na drogach oraz w przyszłych prognozach pogody (ponieważ warunki pogodowe znacząco wpływają na zachowanie konsumentów). DM oceniał różne algorytmy predykcyjne, a wybrane rozwiązanie zapewnia teraz tak dokładne prognozy, że okazało się potężnym wsparciem dla planowania zmianowego. W oparciu o prognozy codziennej sprzedaży w wysokiej rozdzielczości dla każdego sklepu, pracownicy mogą teraz wprowadzać osobiste preferencje do harmonogramu zmian od czterech do ośmiu tygodni wcześniej. Po zatwierdzeniu ich zmiany prawdopodobnie nie ulegną zmianie, mogą polegać na planie długoterminowym, a zmiana w ostatniej chwili jest wydarzeniem wyjątkowym. Pokazuje to, w jaki sposób zastosowanie analizy predykcyjnej w DM zwiększa efektywność operacyjną w sklepie, a jednocześnie przyczynia się do lepszej równowagi między życiem zawodowym a prywatnym pracowników sklepu. Business Intelligence Guide 20172017, isreport, isi Medien Mnchen, lub cf. blue-yonderendm-drogerie-markt-pl. html 10 9 2 2006 Q4 2007 10 Najlepsze praktyki w zakresie najlepszych danych w różnych branżach 2.2. Doświadczenie klienta 2.2.1 Analiza wpływu społecznego na zachowanie klientów Aby uzyskać wgląd w satysfakcję klienta i przyszłe zapotrzebowanie, firmy używają numeru różnych modeli biznesowych. Konwencjonalne podejście polega na przeprowadzeniu badań rynkowych na bazie klientów, ale tworzy to uogólniony pogląd bez skupiania się na indywidualnych potrzebach i zachowaniach konsumentów. Problem, który stanowi wyzwanie dla dostawców usług telekomunikacyjnych, polega na rezygnacji klientów (utracie klientów przez pewien okres czasu). Aby pomóc w zmniejszeniu liczby rezygnacji, organizacje zazwyczaj analizują wzorce użytkowania poszczególnych subskrybentów i ich własną jakość usług. Oferują one również określone nagrody11, dzięki którym niektórzy klienci są lojalni, na podstawie parametrów takich jak wydatki klientów, wykorzystanie i długość subskrypcji. W przeszłości wysiłki zmierzające do utrzymania na podstawie indywidualnej wartości klienta doprowadziły do ​​pewnej poprawy lojalności12, ale odejście klienta pozostaje problemem dla dostawców (zob. Wykres 7). Aby lepiej przewidzieć zachowania klientów, T-Mobile USA zaczęło uwzględniać relacje społeczne między subskrybentami w modelu zarządzania odejściami.13 Organizacja stosuje technikę wielografową, podobną do stosowanych metod. Stwarzanie tej zupełnie nowej perspektywy swoich klientów Aplikacja mobilna wzbogacająca dotychczasową analizę danych (historycznie pobierane z systemów rozliczeniowych i elementów sieci komunikacyjnej). Ponadto, obecnie pobierana jest z grubsza jedna petabajta surowych danych, w tym informacje z sieciowych kanałów zwrotnych i sieci społecznościowych, aby pomóc wyłapać wyrafinowane mechanizmy stojące za churn klienta. To wysoce innowacyjne podejście zostało już opłacone dla T-Mobile. Już po pierwszym kwartale korzystania z nowego modelu zarządzania odejściem, organizacje rezygnują ze spadku o 50 w porównaniu z tym samym kwartałem w poprzednim roku. Opóźniony prepaid Opóźniony trend Opóźniony trend Opłacalny trend 6 5 Wskaźnik rezygnacji () w analizie sieci społecznościowej, w celu zidentyfikowania tzw. Przywódców plemion. Są to ludzie, którzy mają silny wpływ na większe, połączone grupy. Jeśli lider plemienia przełączy się na usługę konkurencji, prawdopodobne jest, że wielu jej znajomych i członków rodziny również przełączy ją na efekt domina. Dzięki tej zmianie w sposobie obliczania wartości klienta, T-Mobile poprawił swój pomiar tak, aby obejmował nie tylko wydatki na subskrypcję na całe życie klienta w usługach mobilnych, ale także rozmiar jego sieci społecznościowej lub plemienia (patrz Rysunek 8). 4 3 2 1 0 Q2 2005 Q4 2005 Q2 2006 Opłacony prepaid Q4 2006 Q2 2007 Mieszany trend Postpaid Trend przedpłacony Trend mieszany Q4 2007 Q2 2008 Wykres 8: Identyfikacja osób mających wpływ na klienta w bazie abonentów telefonii komórkowej Postpaid Prepaid Blended Postpaid trend Trend prepaid Rysunek 7: Rozwój Połączony trend wskaźników abonentów od klientów, z: Mobile Churn and Loyalty Strategies, Informa, s. 24 Śledzenie lojalności klientów, Informa, 2017 11 Q4 2006 12 2007 Q2 2007 MobileQ4Churn Q2 Lojalność 2008 i strategie, wydanie 2, Informa, 2009 Wyzwania T-Mobile wymierają z danymi, Brett Sheppard, OReilly Strata, 2017 cf. strata. oreilly201708t-mobile-challenges-churn-with. html 13 Q2 2008 Najlepsze praktyki dla najlepszych danych w różnych branżach 2.2.2 Unikanie stanów magazynowych dla zadowolenia klientów Jest to częste i rozczarowujące doświadczenie dla kupujących: gdy znajdą idealny produkt ubrania, odkrywają, że rozmiar, którego potrzebują, jest niedostępny. Wraz z rosnącą konkurencją w segmencie tekstylnym i odzieżowym dostępność popularnej odzieży jest obecnie ograniczona. Jest to spowodowane konsolidacją marek i przyspieszonymi cyklami produktów. W niektórych przypadkach pomiędzy pierwszym projektem odzieży a jej przybyciem w sklepie są tylko trzy tygodnie. 14. Częste wprowadzanie nowych kolekcji, prowadzonych pionowo zorganizowanymi łańcuchami, zawęża zamówienia artykułów do jednej partii. Stwarza to ryzyko dla łańcuchów odzieżowych, sprawiając, że ważniejsze niż kiedykolwiek jest precyzyjne przewidywanie zapotrzebowania konsumentów na dany produkt. Zdolność do prawidłowego przewidywania popytu stała się kluczowym czynnikiem dla rentownego biznesu. Wielokanałowy detalista Otto Group zdał sobie sprawę, że konwencjonalne metody prognozowania popytu na elementy katalogu online i wysyłkowego okazały się niewystarczające w coraz bardziej konkurencyjnym środowisku. W przypadku 63 pozycji odchylenie (w stosunku do rzeczywistej wielkości sprzedaży) przekroczyło około 20,15. Grupa doceniła ryzyko biznesowe zarówno nadprodukcji, jak i niedoborów. Nadprodukcja wpłynie na rentowność i zamknie za dużo kapitału. Niedobór denerwowałby klientów. Wychodząc naprzeciw zapotrzebowaniu klientów, w szczególności wysokim oczekiwaniom inwestorów cyfrowych przy dokonywaniu zakupów online, Grupa Otto zastosowała innowacyjne i destrukcyjne podejście do poprawy swojej zdolności dostarczania (zob. Wykres 9). Rozbieżność prognozy 63 odchylenie prognozowania gt 20 1000 500 Częstotliwość bezwzględna Prognoza klasyczna rozwija ryzyko merchandisingu 100 20 0 20 Przewidywania klasyczne Neuro Bayes rozwija ryzyko zaległości 11 prognoza odchylenie gt 100 100 200 Prognoza z Neuro Bayes Rysunek 9: Względne odchylenie prognozy od rzeczywistej wielkości sprzedaży, od: Big Data amp Predictive Analytics Der Nutzen von Daten fr przise Prognosen und Entscheidungen in der Zukunft, Grupa Otto, Michael Sinn Conference Talk Big Data Europe, Zurich, 28 sierpnia 2017 Mrkte in der globalen Modeindustrie, Patrik Aspers, Year Book 20072008, Instytut Studiów Społecznych im. Maxa Plancka 14 Otto rechnet mit knstlicher Intelligenz, Lebensmittel Zeitung, 21 sierpnia 2009 15 11 12 Big Data Najlepsze praktyki w różnych branżach 70 63 60 50 40 30 20 11 10 0 Konwencjonalna prognoza popytu Prognoza popytu z analityką predykcyjną Rysunek 10: Procent pozycji katalogowych z faktycznymi wartościami sprzedaży odbiegającymi o więcej niż 20 od prognozy popytu. Źródło: Perfektes Bestandsmanagement durch Predictive Analytics, Mathias Stben, Grupa Otto, 29. Niemiecki Kongres Logistyczny, październik 2017 Po ocenie szeregu rozwiązań do generowania stabilnych prognoz wielkości sprzedaży, Grupa Otto ostatecznie odniosła sukces, stosując metodę, która powstała w dziedzina fizyki wysokich energii. Wykorzystano wielowymiarowe narzędzie analityczne, które wykorzystuje zdolności samokształcenia z technik sieci neuronowych i łączy je ze statystykami Bayesa16. Dzięki temu narzędziu analitycznemu grupa stworzyła zupełnie nowy silnik prognostyczny, który wyszkoliła narzędzie z danymi historycznymi z 16 poprzednich sezonów. ciągłe wprowadzanie do narzędzia z 300 milionami rekordów transakcji tygodniowo od bieżącego sezonu. Ten nowy system generuje ponad miliard indywidualnych prognoz rocznie i przyniósł już przekonujące wyniki. W przypadku zaledwie 11 pozycji katalogowych brakuje prognozy sprzedaży o więcej niż 20 (zob. Rys. 10), Grupa Otto jest teraz w stanie lepiej zaspokoić potrzeby klientów.17 Jednocześnie nowe podejście prognostyczne obniża poziom zapasów, poprawiając rentowność i dostępność funduszy. Cf. neurobayes. phi-t. deindex. phppublic-information 16 Treffsichere Absatzprognose mit Predictive Analytics, Michael Sinn, Konferencja Dyskusja na temat Big Data amp Analytics Kongress, Kolonia, 19 czerwca 2017 17 cf. youtubewatchvhAE2Mui5lRA Big Data Najlepsze praktyki w różnych branżach 2.3 Nowe modele biznesowe 2.3.1 Analityka tłumu dostarcza informacji o sprzedaży detalicznej i reklamie Aby zapewnić efektywne usługi transmisji głosu i danych, operatorzy sieci muszą nieustannie rejestrować zestaw danych dla każdego subskrybenta. Oprócz rejestrowania korzystania z usług mobilnych (do celów rachunkowych i rozliczeniowych), operatorzy muszą również rejestrować każdą lokalizację abonenta, aby mógł kierować połączenia i strumienie danych do wieży telefonicznej, do której podłączony jest telefon abonencki. W ten sposób każdy subskrybent tworzy cyfrowy szlak podczas przemieszczania się po sieci dostawcy. W większości krajów to tylko niewielka grupa operatorów sieciowych, którzy zdobyli większość populacji jako klienci, a ich połączone cyfrowe ścieżki bazy abonenckiej zapewniają kompleksowe odzwierciedlenie społeczeństwa, a dokładniej, sposobu poruszania się społeczeństwa. Na przykład można ocenić atrakcyjność konkretnej ulicy dla otwarcia nowego sklepu, w oparciu o analizę wysokiej rozdzielczości, w jaki sposób ludzie poruszają się i odpoczywać w tym obszarze, oraz znaleźć godziny otwarcia, które prawdopodobnie wytworzą maksymalną liczbę kroków (patrz Rysunek 11) . W szerszym kontekście można również zobaczyć wpływ takich wydarzeń, jak kampanie marketingowe i otwarcie sklepu konkurencji, analizując wszelkie zmiany w wzorcach ruchów. Jeśli w danych uwzględniono podział na płeć i grupę wiekową, a uwzględnione są geolokalizowane zestawy danych i aktywność sieci społecznościowych, segmentacja ta zwiększa jeszcze wartość dla sprzedawców detalicznych i reklamodawców. W przeszłości organizacje mogły jedynie wewnętrznie wykorzystywać dane o lokalizacji i użytkowaniu z sieci komórkowych. Wynika to z przepisów o ochronie prywatności, które ograniczają wykorzystanie poszczególnych informacji o subskrybentach. Ale kiedy tożsamość subskrybenta została oddzielona od danych ruchu, istotna wartość biznesowa pozostaje w tych anonimowych danych o tłumie, jak odkrył Telefonica. Wraz z uruchomieniem globalnej linii biznesowej Telefonica Digital, operator sieci napędza obecnie innowacje biznesowe poza swoimi podstawowymi jednostkami biznesowymi i markami. W ramach Telefonica Digital inicjatywa Dynamic Insights skomercjalizowała analizę danych o ruchu, generując dodatkowe przychody od klientów detalicznych, nieruchomości, rekreacyjnych i medialnych.18 Inni przewoźnicy opracowali podobne oferty, takie jak usługa Verizons Precision Market Insights.19. obszary miejskie, gęstość cyfrowych ścieżek jest wystarczająco wysoka, aby skorelować zbiorowe zachowanie tłumu abonentów z charakterystyką określonej lokalizacji lub obszaru. Rysunek 11: Analiza ruchu klientów w danym miejscu na podstawie danych subskrybentów mobilnych, z blogu. telefonicapress-releasetelefonica-dynamic-insights-launch-smart-steps-in-uk Cf. dynamicinsights. telefonica 18 Cf. verizonenterpriseindustryretailprecision-market-insights 19 13 14 Big Data Najlepsza praktyka w różnych branżach 2.3.2 Tworzenie nowych produktów ubezpieczeniowych z danych geograficznych Czułość klimatu jest charakterystyczna dla rolnictwa, ponieważ lokalne temperatury, godziny nasłonecznienia i poziomy opadów bezpośrednio wpływają na plon . Wraz ze wzrostem występowania ekstremalnych warunków pogodowych spowodowanych globalnym ociepleniem, zmiany klimatyczne stały się poważnym ryzykiem dla rolników20. Aby złagodzić wpływ niedoborów plonów, rolnicy stosują polisy ubezpieczeniowe, aby pokryć potencjalne straty finansowe. Firmy ubezpieczeniowe są z kolei narażone na coraz bardziej nieprzewidywalne lokalne ekstremalne warunki pogodowe. Z jednej strony konwencjonalne modele ryzyka oparte na danych historycznych nie są już odpowiednie do przewidywania przyszłych strat ubezpieczonych.21 Z drugiej strony, wnioski muszą być kontrolowane dokładniej, ponieważ szkody mogą się różnić w dotkniętym regionie. Dla rolników połączenie tych dwóch aspektów powoduje wyższe stawki ubezpieczeniowe i wolniejszą spłatę roszczeń o odszkodowanie. In the United States, most private insurance companies viewed crop production as too risky to insure without federal subsidies.22 In 2006, The Climate Corporation started out to create a new weather simulation model based on 2.5 million temperature and precipitation data points, combined with 150 million soil observations. The high resolution of its simulation grid allows the company to dynamically calculate the risk and pricing for weather insurance coverage on a per-field basis across the entire country (see Figure 12). As the tracking of local growing conditions and the calculation of crop shortfall are performed in real time, payouts to policy holders are executed automatically when bad weather conditions occur. This eliminates the need for sophisticated and time-consuming claims processes. Based on 10 trillion simulation data points23, The Climate Corporations new insurance business model is now successfully established. After only six years, the organizations insurance services have been approved across all 50 states in the U. S. Figure 12: Real-time tracking of weather conditions and yield impact per field screenshot taken from climateproductsclimate-apps Managing the Risks of Extreme Events and Disasters to Advance Climate Change Adaptation, Chapter 4.3.4, Intergovernmental Panel on Climate 20 Change (IPCC), 2017 cf. ipcc. chpdfspecial-reportssrexSREXFullReport. pdf Warming of the Oceans and Implications for the (Re-)Insurance Industry, The Geneva Association, June 2017 21 Weather Insurance Reinvented, Linda H. Smith, DTN The Progressive Farmer, November 2017 cf. dtnprogressivefarmer 22 About us, The Climate Corporation, cf. climatecompanyabout 23 Big Data in Logistics 3 BIG DATA IN LOGISTICS Companies are learning to turn large-scale quantities of data into competitive advantage. Their precise forecasting of market demand, radical customization of services, and entirely new business models demonstrate exploitation of their previously untapped data. As todays best practices touch many vertical markets, it is reasonable to predict that Big Data will also become a disruptive trend in the logistics industry. However, the application of Big Data analytics is not immediately obvious in this sector. The particularities of the logistics business must be thoroughly examined first in order to discover valuable use cases. 3.1 Logistics as a Data-driven Business A kick-start for discussion of how to apply Big Data is to look at creating and consuming information. In the logistics industry, Big Data analytics can provide competitive advantage because of five distinct properties. These five properties highlight where Big Data can be most effectively applied in the logistics industry. They provide a roadmap to the well of unique information assets owned by every logistics provider. In the following sections, we identify specific use cases that exploit the value of this information, and contribute to operational efficiency, a better customer experience, or the development of new business models. Optimization of service properties like delivery time, resource utilization, and geographical coverage is an inherent challenge of logistics 1. Optimization to the core Large-scale logistics operations require data to run efficiently. The earlier this information is available and the more precise the information is, the better the optimization results will become Advanced predictive techniques and real-time processing promise to provide a new quality in capacity forecast and resource control The delivery of tangible goods requires a direct customer interaction at pickup and delivery 2. Tangible goods, tangible customers 3. In sync with customer business On a global scale, millions of customer touch points a day create an opportunity for market intelligence, product feedback or even demographics Big Data concepts provide versatile analytic means in order to generate valuable insight on consumer sentiment and product quality Modern logistics solutions seamlessly integrate into production and distribution processes in various industries The tight level of integration with customer operations let logistics providers feel the heartbeat of individual businesses, vertical markets, or regions The application of analy tic methodology to this comprehensive knowledge reveals supply chain risks and provides resilience against disruptions The transport and delivery network is a high-resolution data source 4. A network of information Apart from using data for optimizing the network itself, network data may provide valuable insight on the global flow of goods The power and diversity of Big Data analytics moves the level of observation to a microeconomic viewpoint Local presence and decentralized operations is a necessity for logistics services 5. Global coverage, local presence A fleet of vehicles moving across the country to automatically collect local information along the transport routes Processing this huge stream of data originating from a large delivery fleet creates a valuable zoom display for demographic, environmental, and traffic statistics 15 16 Big Data in Logistics Big Data in Logistics 17 New Customer Base Big Data in Logistics Shop The Data-driven Logistics Provider 5 Existing Custom er Base Customer Loyalty Management Financial Industry Market and customer intelligence External Online Sources Manufacturing FMCG SME Marketing and Sales Product Management New Business Address Verification Market Intelligence Supply Chain Monitoring Environmental Statistics 11 Environmental Intelligence CO2 Sensors attached to delivery vehicles produce fine-meshed statistics on pollution, traffic density, noise, parking spot utilization, etc. Continuous sensor data Service Improvement and Product Innovation Retail Operations Order volume, received service quality 6 Market Research Commercial Data Services Public customer information is mapped against business parameters in order to predict churn and initiate countermeasures High-tech Pharma Public Authorities Customer sentiment and feedback A comprehensive view on customer requirements and service quality is used to enhance the product portfolio 3 8 Supply chain monitoring data is used to create market intelligence reports for small and medium-sized companies Strategic Network Planning Long-term demand forecasts for transport capacity are generated in order to support strategic investments into the network Commerce Sector 9 Households SME Network flow data Core Market Intelligence for SME Location, traffic density, directions, delivery sequence Tr a n s p o r t N e t w ork Financial Demand and Supply Chain Analytics 1 Real-time Route Optimization Delivery routes are dynamically calculated based on delivery sequence, traffic conditions and recipient status Real-time incidents A micro-economic view is created on global supply chain data that helps financial institutions improve their rating and investment decisions Network flow data 10 2 Location, destination, availability Crowd-based Pickup and Delivery A large crowd of occasionally available carriers pick up or deliver shipments along routes they would take anyway Address Verification Fleet personnel verifies recipient addresses which are transmitted to a c entral address verification service provided to retailers and marketing agencies 4 Operational Capacity Planning Short - and mid-term capacity planning allows optimal utilization and scaling of manpower and resources 7 Risk Evaluation and Resilience Planning By tracking and predicting events that lead to supply chain disruptions, the resilience level of transport services is increased Flow of data Flow of physical goods 2017 Detecon International 18 Big Data in Logistics 3.2 Use Cases Operational Efficiency A straightforward way to apply Big Data analytics in a business environment is to increase the level of efficiency in operations. This is simply what IT has always been doing accelerating business processes but Big Data analytics effectively opens the throttle. 3.2.1 Last-mile optimization A constraint in achieving high operational efficiency in a distribution network occurs at the last mile. 24 This final hop in a supply chain is often the most expensive one. The optimization of last-mile delivery to drive down product cost is therefore a promising application for Big Data techniques. Two fundamental approaches make data analysis a powerful tool for increasing last-mile efficiency. In a first and somewhat evolutionary step, a massive stream of information is processed to further maximize the performance of a conventional delivery fleet. This is mainly achieved by real-time optimization of delivery routes. The second, more disruptive approach utilizes data processing to control an entirely new last-mile delivery model. With this, the raw capacity of a huge crowd of randomly moving people replaces the effectiveness of a highly optimized workforce. 1 Real-time route optimization The traveling salesmen problem was formulated around eighty years ago, but still defines the core challenge for last-mile delivery. Route optimization on the last mile aims at saving time in the delivery process. Rapid processing of real-time information supports this goal in multiple ways. When the delivery vehicle is loaded and unloaded, a dynamic calculation of the optimal delivery sequence based on sensor-based detection of shipment items frees the staff from manual sequencing. On the road, telematics databases are tapped to automatically change delivery routes according to current traffic conditions. And routing intelligence considers the availability and location information posted by recipients in order to avoid unsuccessful delivery attempts. In summary, every delivery vehicle receives a continuous adaptation of the delivery sequence that takes into account geographical factors, environmental factors, and recipient status. What makes this a Big Data problem It requires the execution of combinatorial optimization procedures fed from correlated streams of real-time events to dynamically re-route vehicles on the go. As a result, each driver receives instant driving direction updates from the onboard navigation system, guiding them to the next best point of delivery. DHL SmartTruck Daily optimized initial tour planning based on incoming shipment data Dynamic routing system, which recalculates the routes depending on the current order and traffic situation Cuts costs and improves CO2 efficiency, for example by reducing mileage The term last mile has its origin in telecommunications and describes the last segment in a communication network that actually reaches the 24 customer. In the logistics sector, the last mile is a metaphor for the final section of a supply chain, in which goods are handed over to the recipient. Source: The definition of the first and last miles, DHL Discover Logistics, cf. dhl-discoverlogisticscmsencoursetechnologies reinforcementfirst. jsp Big Data in Logistics 2 Crowd-based pick-up and delivery The wisdom and capacity of a crowd of people has become a strong lever for effectively solving business problems. Sourcing a workforce, funding a startup, or performing networked research are just a few examples of requisitioning resources from a crowd. Applied to a distribution network, a crowd-based approach may create substantial efficiency enhancements on the last mile. The idea is simple: Commuters, taxi drivers, or students can be paid to take over lastmile delivery on the routes that they are traveling anyway. Scaling up the number of these affiliates to a large crowd of occasional carriers effectively takes load off the delivery fleet. Despite the fact that crowd-based delivery has to be incentivized, it has potential to cut last-mile delivery costs, especially in rural and sparsely populated areas. On the downside, a crowd-based approach also issues a vital challenge: The automated control of a huge number of randomly moving delivery resources. This requires extensive data processing capabilities, answered by Big Data techniques such as complex event processing and geocorrelation. A real-time data stream is traced in DHL MyWays order to assign shipments to available carriers, based on their respective location and destination. Interfaced through a mobile application, crowd affiliates publish their current position and accept pre-selected delivery assignments. The above two use cases illustrate approaches to optimizing last-mile delivery, yet they are diametrically opposed. In both cases, massive real-time information (originating from sensors, external databases, and mobile devices) is combined to operate delivery resources at maximum levels of efficiency. And both of these Big Data applications are enabled by the pervasiveness of mobile technologies. Unique crowd-based delivery for B2C parcels Flexible delivery in time and location Using existing movement of city residents myways 19 20 Big Data in Logistics 3.2.2 Predictive network and capacity planning Optimal utilization of resources is a key competitive advantage for logistics providers. Excess capacities lower profitability (which is critical for low-margin forwarding services), while capacity shortages impact service quality and put customer satisfaction at risk. Logistics providers must therefore perform thorough resource planning, both at strategic and operational levels. Strategic-level planning considers the long-term configuration of the distribution network, and operational-level planning scales capacities up or down on a daily or monthly basis. For both perspectives, Big Data techniques improve the reliability of planning and the level of detail achieved, enabling logistics providers to perfectly match demand and available resources. 3 Strategic network planning At a strategic level, the topology and capacity of the distribution network are adapted according to anticipated future demand. The results from this stage of planning usually drive investments with long requisition and amortization cycles such as investments in warehouses, distribution centers, and custom-built vehicles. More precise capacity demand forecasts therefore increase efficiency and lower the risks of investing in storage and fleet capacity. Big Data techniques support network planning and optimization by analyzing comprehensive historical capacity and utilization data of transit points and transportation routes. In addition, these techniques consider seasonal factors and emerging freight flow trends by learning algorithms that are fed with extensive statistical series. External economic information (such as industry-specific and regional growth forecasts) is included for more accurate prediction of specific transportation capacity demand. In summary, to substantially increase predictive value, a much higher volume and variety of information is exploited by advanced regression and scenario modeling techniques. The result is a new quality of planning with expanded forecast periods this effectively reduces the risk of long-term infrastructure investments and contracted external capacities. It can also expose any impending over-capacity and provide this as automated feedback to accelerate sales volume. This is achieved by dynamic pricing mechanisms, or by transfer of overhead capacities to spot-market trading. Big Data in Logistics 4 Operational capacity planning At operational level, transit points and transportation routes must be managed efficiently on a day-to-day basis. This involves capacity planning for trucks, trains, and aircraft as well as shift planning for personnel in distribution centers and warehouses. Often operational planning tasks are based on historical averages or even on personal experience, which typically results in resource inefficiency. Instead, using the capabilities of advanced analytics, the dynamics within and outside the distribution network are modeled and the impact on capacity requirements calculated in advance. Real-time information about shipments (items that are entering the distribution network, are in transit, and are stored) is aggregated to predict the allocation of resources for the next 48 hours. This data is automatically sourced from warehouse management systems and sensor data along the transportation chain. In addition detection of ad-hoc changes in demand is derived from externally available customer information (e. g. data on product releases, factory openings, or unexpected bankruptcy). Additionally, local incidents are detected (e. g. regional disease outbreaks or natural disasters) as these can skew demand figures for a particular region or product. This prediction of resource requirements helps Both of the above Big Data scenarios increase resource efficiency in the distribution network, but the style of data processing is different. The strategic optimization combines a high data volume from a variety of sources in order to support investment and contracting decisions, while the operational optimization continuously forecasts network flows based on real-time streams of data. DHL Parcel Volume Prediction operating personnel to scale capacity up or down in each particular location. But theres more to it than that. A precise forecast also reveals upcoming congestions on routes or at transit points that cannot be addressed by local scaling. For example, a freight aircraft that is working to capacity must leave behind any further expedited shipments at the airport of origin. Simulation results give early warning of this type of congestion, enabling shipments to be reassigned to uncongested routes, mitigating the local shortfall. This is an excellent example of how Big Data analytics can turn the distribution network into a self-optimizing infrastructure. Analytic tool to measure influences of external factors on the expected volume of parcels Correlates external data with internal network data Results in a Big Data Prediction Model that significantly increases operational capacity planning Ongoing research project by DHL Solutions amp Innovation 21 22 Big Data in Logistics 3.3 Use Cases Customer Experience The aspect of Big Data analytics that currently attracts the most attention is acquisition of customer insight. For every business, it is vitally important to learn about customer demand and satisfaction. But as organizations experience increased business success, the individual customer can blur into a large and anonymous customer base. Big Data analytics help to win back individual customer insight and to create targeted customer value. 3.3.1 Customer value management Clearly, data from the distribution network carries significant value for the analysis and management of customer relations. With the application of Big Data techniques, and enriched by public Internet mining, this data can be used to minimize customer attrition and understand customer demand. 5 Customer loyalty management For most business models, the cost of winning a new customer is far higher than the cost of retaining an existing customer. But it is increasingly difficult to trace and analyze individual customer satisfaction because there are more and more indirect customer touch points (e. g. portals, apps, and indirect sales channels). Because of this, many businesses are failing to establish effective customer retention programs. Smart use of data enables the identification of valuable customers who are on the point of leaving to join the competition. Big Data analytics allow a comprehensive assessment of customer satisfaction by merging multiple extensive data sources. For logistics providers, this materializes in a combined evaluation of records from customer touch points, operational data on logistics service quality, and external data. How do these pieces fit together Imagine the scenario of a logistics provider noticing a customer who lowers shipment volumes despite concurrently publishing steady sales records through newswire. The provider then checks delivery records, and realizes that this customer recently experienced delayed shipments. Looking at the bigger picture, this information suggests an urgent need for customer retention activity. To achieve this insight not just with one customer but across the entire customer base, the logistics provider must tap multiple data sources and use Big Data analytics. Customer touch points include responses to sales and marketing activities, customer service inquiries, and complaint management details. This digital customer trail is correlated with data from the distribution network comprising statistical series on shipping volume and received service quality levels. In addition, the Internet provides useful customer insight: Publicly available information from news agencies, annual reports, stock trackers, or even sentiments from social media sites enrich the logistics providers internal perspective of each customer. From this comprehensive information pool, the logistics provider can extract the attrition potential of every single customer by applying techniques such as semantic text analytics, natural-language processing, and pattern recognition. On automatically generated triggers, the provider then initiates proactive counter-measures and customer loyalty programs. Although business relationships in logistics usually relate to the sender side, loyalty management must also target the recipient side. Recipients are even more affected by poor service quality, and their feedback influences sender selection for future shipments. A good example of this is Internet or catalog shopping: Recurring customer complaints result in the vendor considering a switch of logistics provider. But to include recipients into loyalty management requires yet more data to be processed, especially in B2C markets. Big Data analytics are essential, helping to produce an integrated view of customer interactions and operational performance, and ensure sender and recipient satisfaction. Big Data in Logistics 6 Continuous service improvement and product innovation Logistics providers collect customer feedback as this provides valuable insight into service quality and customer expectations and demands. This feedback is a major source of information for continuous improvement in service quality. It is also important input for the ideation of new service innovations. To get solid results from customer feedback evaluation, it is necessary to aggregate information from as many touch points as possible. In the past, the single source of data has been ingests from CRM systems and customer surveys. But today, Big Data solutions provide access to gargantuan volumes of useful data stored on public Internet sites. In social networks and on 3.3.2 Suppy chain risk management discussion forums, people openly and anonymously share their service experiences. But extracting by hand relevant customer feedback from the natural-language content created by billions of Internet users is like looking for that proverbial needle in a haystack. The uninterrupted direct supply of materials is essential to businesses operating global production chains. Lost, delayed, or damaged goods have an immediate negative impact on revenue streams. Whereas logistics providers are prepared to control their own operational risk in supply chain services, an increasing number of disruptions result from major events such as civil unrest, natural disasters, or sudden economic developments.25 To anticipate supply chain disruptions and mitigate the effect of unforeseen incidents, global enterprises seek to deploy business continuity management (BCM) measures.26 Sophisticated Big Data techniques such as text mining and semantic analytics allow the automated retrieval of customer sentiment from huge text and audio repositories. In addition, this unsolicited feedback on quality and demand can be broken down by region and time. This enables identification of correlation with one-time incidents and tracking the effect of any initiated action. In summary, meticulous review of the entire public Internet brings unbiased customer feedback to the logistics provider. This empowers product and operational managers to design services capable of meeting customer demand. This demand for improved business continuity creates an opportunity for logistics providers to expand their customer value in outsourced supply chain operations. Rapid analysis of various information streams can be used to forecast events with a potentially significant or disastrous impact on customer business. In response to arising critical conditions, counter-measures can be initiated early to tackle arising business risks. Are you ready for anything, DHL Supply Chain Matters, 2017, cf. dhlsupplychainmatters. dhlefficiencyarticle24are-you-ready - 25 for-anything Making the right risk decisions to strengthen operations performance, PriceWaterhouseCoopers and MIT Forum for Supply Chain Innovation, 2017 26 23 24 Big Data in Logistics 7 Risk evaluation and resilience planning Contract logistics providers know their customers supply chains in great detail. To cater for the customer need for predictive risk assessment, two things must be linked and continuously checked against each other: A model describing all elements of the supply chain topology, and monitoring of the forces that affect the performance of this supply chain. Data on local developments in politics, economy, nature, health, and more must be drawn from a plethora of sources (e. g. social media, blogs, weather forecasts, news sites, stock trackers, and many other publically available sites), and then aggregated and analyzed. Most of this information stream is unstructured and continuously updated, so Big Data analytics power the retrieval of input that is meaningful in the detection of supply chain risks. Both semantic analytics and complex event processing techniques are required to detect patterns in this stream of interrelated information pieces.27 The customer is notified when a pattern points to a critical condition arising for one of the supply chain elements (e. g. a tornado warning in the region where a transshipment point is located). This notification includes a report on the probability and impact of this risk, and provides suitable counter-measures to mitigate potential disruption. Equipped with this information, the customer can re-plan transport routes or ramp up supplies from other geographies. Robust supply chains that are able to cope with unforeseen events are a vital business capability in todays rapidly changing world. In addition to a resilient and flexible supply chain infrastructure, businesses need highly accurate risk detection to keep running when disaster strikes. With Big Data tools and techniques, logistics providers can secure customer operations by performing predictive analytics on a global scale. Coming Soon A New Supply Chain Risk Management Solution by DHL A unique consultancy and software solution that improves the resilience of your entire supply chain Designed to reduce emergency costs, maintain service levels, protect sales, and enable fast post-disruption recovery Protects your brand and market share, informs your inventory decisions, and creates competitive advantage The Power of Events: An Introduction to Complex Event Processing in Distributed Enterprise Systems, David C. Luckham, Addison-Wesley Long - 27 man, 2001 Big Data in Logistics 3.4 Use Cases New Business Models 3.4.1 B2B demand and supply chain forecast The logistics sector has long been a macroeconomic indicator, and the global transportation of goods often acts as a benchmark for future economic development. The type of goods and shipped volumes indicate regional demand and supply levels. The predictive value of logistics data for the global economy is constituted by existing financial indices measuring the macroeconomic impact of the logistics sector. Examples are the Baltic Dry Index28, a price index for raw materials shipped, and the Dow Jones Transportation Average29, showing the economic stability of the 20 largest U. S. logistics providers. By applying the power of Big Data analytics, logistics providers have a unique opportunity to extract detailed microeconomic insights from the flow of goods through their distribution networks. They can exploit the huge digital asset that is piled up from the millions of daily shipments by capturing demand and supply figures in various geographical and industry segments. 8 The result has high predictive value and this compound market intelligence is therefore a compelling service that can be offered by third parties. To serve a broad range of potential customers, the generated forecasts are segmented by industry, region, and product category. The primary target groups for advanced data services such as these are small and medium-sized enterprises that lack capacity to conduct their own customized market research. Market intelligence for small and medium-sized enterprises The aggregation of shipment records (comprising origin, destination, type of goods, quantity, and value) is an extensive source of valuable market intelligence. As long as postal privacy is retained, logistics providers can refine this data in order to substantiate existing external market research. With regression analysis, DHL Geovista the fine-grained information in a shipment database can significantly enhance the precision of conventional demand and supply forecasts. Online geo marketing tool for SMEs to analyze business potential Provides realistic sales forecast and local competitor analysis based on a scientific model A desired location can be evaluated by using high-quality geodata deutschepost. degeovista Baltic Dry Index, Financial Times Lexicon, cf. lexicon. ftTermtermBaltic-Dry-Index 28 Dow Jones Transportation Average, SampP Dow Jones Indices, cf. djaveragesgotransportation-overview 29 25 26 Big Data in Logistics 9 Financial demand and supply chain analytics Financial analysts depend on data to generate their growth perspectives and stock ratings. Sometimes analysts even perform manual checks on supply chains as the only available source to forecast sales figures or market volumes. So for ratings agencies and advisory firms in the banking and insurance sector, access to the detailed information collected from a global distribution network is particularly valuable. An option for logistics providers is to create a commercial analytics platform allowing a broad range of users to slice and dice raw data according to their field of research effectively creating new revenue streams from the huge amount of information that controls logistics operations. 10 In the above use cases, analytics techniques are applied to vast amounts of shipment data. This illustrates how logistics providers can implement new informationdriven business models. In addition, the monetization of data that already exists adds the potential of highly profitable revenue to the logistics providers top line. 3.4.2 Real-time local intelligence Information-driven business models are frequently built upon existing amounts of data, but this is not a prerequisite. An established product or service can also be extended in order to generate new information assets. For logistics providers, the pickup and delivery of shipments provides a particular opportunity for a complementary new business model. No other industry can provide the equivalent blanket-coverage local presence of a fleet of vehicles that is constantly on the move and geographically distributed. Logistics providers can equip these vehicles with new devices (with camera, sensor, and mobile connectivity miniaturization powered by the Internet of Things) to collect rich sets of information on the go. This unique capability enables logistics providers to offer existing and new customers a completely new set of value-added data services. Address verification The verification of a customers delivery address is a fundamental requirement for online commerce. Whereas address verification is broadly available in industrialized nations, for developing countries and in remote areas the quality of address data is typically poor. This is also partly due to the lack of structured naming schemes for streets and buildings in some locations. Logistics providers can use daily freight, express, and parcel delivery data to automatically verify address data to achieve, for example, optimized route planning with correct geocoding for retail, banking, and public sector entities. DHL Address Management Direct match of input data with reference data Return incomplete or incorrect incoming data with validated data from database Significant increase of data quality for planning purposes (route planning) Big Data in Logistics 11 Environmental intelligence The accelerated growth of urban areas30 increases the importance of city planning activities and environmental monitoring. By using a variety of sensors attached to delivery vehicles, logistics providers can produce rich environmental statistics. Data sets may include measurements of ozone and fine dust pollution, temperature and humidity, as well as traffic density, noise, and parking spot utilization along urban roads. As all of this data can be collected en passant (in passing), it is relatively easy for logistics providers to offer a valuable data service to authorities, environment agencies, and real-estate developers while achieving complementary revenues to subsidize, for example, the maintenance of a large delivery fleet. There are numerous other local intelligence use cases exploiting the ubiquity of a large delivery fleet. From road condition reports that steer plowing or road maintenance squads, to surveys on the thermal insulation of public households, logistics providers are in pole position as search engines in the physical world. Innovative services that provide all kinds of data in microscopic geographical detail are equally attractive to advertising agencies, construction companies, and public bodies such as police and fire departments. Big Data techniques that extract structured information from real-time footage and sensor data are now building a technical backbone for the deployment of new data-driven business models. 3.5 Succcess Factors for Implementing Big Data Analytics Our discussion of Big Data analytics has been focused on the value of information assets and the way in which logistics providers can leverage data for better business performance. This is a good start, as solid use cases are a fundamental requirement for adopting new information-driven business models. But there needs to be more than a positive assessment of business value. The following five success factors must also be in place. 3.5.1 Business and IT alignment In the past, advancements in information management clearly targeted either a business problem or a technology problem. While trends such as CRM strongly affected the way sales and service people work, other trends such as cloud computing have caused headaches for IT teams attempting to operate dynamic IT resources across the Internet. Consequently, business units and the IT department may have different perspectives on which changes are worth adopting and managing. But for an organization to transform itself into an information-driven company one that uses Big Data analytics for competitive advantage both the business units and the IT department must accept and support substantial change. It is therefore essential to demonstrate and align both a business case and an IT case for using Big Data (including objectives, benefits, and risks). To complete a Big Data implementation, there must be a mutual understanding of the challenges as well as a joint commitment of knowledge and talent. According to the United Nations, by 2050 85.9 of the population in developed countries will live in urban areas. Taken from: Open-air computers, 30 The Economist, Oct. 27, 2017 cf. economistnewsspecial-report21564998-cities-are-turning-vast-data-factories-open-air-computers 27 28 Big Data in Logistics 3.5.2 Data transparency and governance Big Data use cases often build upon a smart combination of individual data sources which jointly provide new perspectives and insights. But in many companies the reality is that three major challenges must be addressed to ensure successful implementation. First, to locate data that is already available in the company, there must be full transparency of information assets and ownership. Secondly, to prevent ambiguous data mapping, data attributes must be clearly structured and explicitly defined across multiple databases. And thirdly, strong governance on data quality must be maintained. The validity of mass query results is likely to be compromised unless there are effective cleansing procedures to remove incomplete, obsolete, or duplicate data records. And it is of utmost importance to assure high overall data quality of individual data sources because with the boosted volume, variety, and velocity of Big Data it is more difficult to implement efficient validation and adjustment procedures. 3.5.3 Data privacy In the conceptual phase of every Big Data project, it is essential to consider data protection and privacy issues. Personal data is often revealed when exploiting information assets, especially when attempting to gain customer insight. Use cases are typically elusive in countries with strict data protection laws, yet legislation is not the only constraint. Even when a use case complies with prevailing laws, the large-scale collection and exploitation of data often stirs public debate and this can subsequently damage corporate reputation and brand value. or breaks reliable and meaningful insights. In most industries, the required mathematical and statistical skillset is scarce. In fact, a talent war is underway, as more and more companies recognize they must source missing data science skills externally. Very specialized knowledge is required to deploy the right techniques for each particular data processing problem, so organizations must invest in new HR approaches in support of Big Data initiatives. 3.5.5 Appropriate technology usage Many data processing problems currently hyped as Big Data challenges could, in fact, have been technically solved five years ago. But back then, the required technology investment would have shattered every business case. Now at a fraction of the cost, raw computing power has exponentially increased, and advanced data processing concepts are available, enabling a new dimension of performance. The most prominent approaches are in-memory data storage and distributed computing frameworks. However, these new concepts require adoption of entirely new technologies. 3.5.4 Data science skills For IT departments to implement Big Data projects therefore requires a thorough evaluation of established and new technology components. It needs to be established whether these components can support a particular use case, and whether existing investments can be scaled up for higher performance. For example, in-memory databases (such as the SAP HANA system) are very fast but have a limited volume of data storage, while distributed computing frameworks (such as the Apache Hadoop framework) are able to scale out to a huge number of nodes but at the cost of delayed data consistency across multiple nodes. A key to successful Big Data implementation is mastery of the many data analysis and manipulation techniques that turn vast raw data into valuable information. The skillful application of computational mathematics makes In summary, these are the five success factors that must be in place for organizations to leverage data for better business performance. Big Data is ready to be used. Outlook OUTLOOK Looking ahead, there are admittedly numerous obstacles to overcome (data quality, privacy, and technical feasibility, to name just a few) before Big Data has pervasive influence in the logistics industry. But in the long run, these obstacles are of secondary importance because, first and foremost, Big Data is driven by entrepreneurial spirit. Several organizations have led the way for us Google, Amazon, Facebook, and eBay, for example, have already succeeded in turning extensive information into business. Now we are beginning to see first movers in the logistics sector. These are the entrepreneurial logistics providers that refuse to be left behind the opportunity-oriented organizations prepared to exploit data assets in pursuit of the applications described in this trend report. But apart from the leading logistics providers that implement specific Big Data opportunities, how will the entire logistics sector transform into a data-driven industry What evolution can we anticipate in a world where virtually every single shipped item is connected to the Internet We may not know all of the answers right now. But this trend report has shown there is plenty of headroom for valuable Big Data innovation. Joining resources, labor, and capital, it is clear that information has become the fourth production factor and essential to competitive differentiation. It is time to tap the potential of Big Data to improve operational efficiency and customer experience, and create useful new business models. Jeśli już przesłałeś plik, nazwa może być błędnie wpisana lub znajduje się w innym folderze. Inne możliwe przyczyny Może pojawić się błąd 404 dla obrazów, ponieważ włączona jest funkcja Hot Link Protection, a domena nie znajduje się na liście autoryzowanych domen. Jeśli przejdziesz do tymczasowego adresu URL (nazwa użytkownika ip) i otrzymasz ten błąd, być może wystąpił problem z zestawem reguł przechowywanym w pliku. htaccess. Możesz spróbować zmienić nazwę tego pliku na. htaccess-backup i odświeżyć stronę, aby sprawdzić, czy to rozwiązuje problem. Możliwe też, że przypadkowo usunąłeś swój główny dokument lub konieczne może być ponowne utworzenie konta. Tak czy inaczej, natychmiast skontaktuj się ze swoim usługodawcą internetowym. Używasz WordPressa Zobacz rozdział o błędach 404 po kliknięciu łącza w WordPress. Brakujące lub uszkodzone pliki Po otrzymaniu błędu 404 sprawdź adres URL, z którego próbujesz korzystać w przeglądarce. Mówi on serwerowi, z jakiego zasobu ma próbować wysłać żądanie. W tym przykładzie plik musi znajdować się w publichtmlexampleExample Zauważ, że CaSe jest ważne w tym przykładzie. Na platformach, które wymuszają analizę wrażliwości na przypadki, i Eksample nie są tymi samymi lokalizacjami. W przypadku domen addon plik musi znajdować się w publichtmladdondomainexampleExample, a w nazwach jest rozróżniana wielkość liter. Zepsuty obraz Gdy masz brakujący obraz na swojej stronie, możesz zobaczyć pudełko na twojej stronie z czerwonym X, w którym brakuje obrazu. Kliknij prawym przyciskiem myszy X i wybierz Właściwości. Właściwości pokażą ścieżkę i nazwę pliku, którego nie można znaleźć. Jest to zależne od przeglądarki, jeśli nie widzisz ramki na stronie z czerwonym X, spróbuj kliknąć prawym przyciskiem myszy na stronie, a następnie wybierz Wyświetl informacje o stronie i przejdź do zakładki Media. W tym przykładzie plik obrazu musi znajdować się w publichtmlcgi-sysimages. Zauważ, że CaSe jest ważne w tym przykładzie. Na platformach, które wymuszają rozróżnianie wielkości liter, PNG i png nie są tymi samymi lokalizacjami. Podczas pracy z WordPressem, błędy 404 Page Not Found często pojawiają się po aktywowaniu nowego motywu lub zmianie reguł przepisywania w pliku. htaccess. Kiedy napotkasz błąd 404 w WordPressie, masz dwie możliwości jego poprawienia. Opcja 1: Popraw log Permalinki do WordPress. W menu nawigacji po lewej stronie w WordPress kliknij Ustawienia gt Łącza bezpośrednie (zapisz bieżące ustawienie Jeśli używasz niestandardowej struktury, skopiuj lub zapisz niestandardową strukturę gdzieś.) Wybierz Domyślne. Kliknij Zapisz ustawienia. Zmień ustawienia z powrotem na poprzednią konfigurację (przed wybraną Domyślnie). Przywróć niestandardową strukturę, jeśli ją masz. Kliknij Zapisz ustawienia. Spowoduje to zresetowanie Permalink i naprawienie problemu w wielu przypadkach. Jeśli to nie zadziała, być może będziesz musiał bezpośrednio edytować swój plik. htaccess. Opcja 2: Zmodyfikuj plik. htaccess Dodaj następujący fragment kodu na górze pliku. htaccess: BEGIN WordPress ltIfModule modrewrite. cgt RewriteEngine On RewriteBase RewriteRule index. php - L RewriteCond - f RewriteCond - d RewriteRule. index. php L ltIfModulegt Koniec WordPress Jeśli Twój blog wyświetla niewłaściwą nazwę domeny w odnośnikach, przekierowuje do innej witryny lub brakuje obrazów i stylu, wszystkie są zwykle związane z tym samym problemem: masz błędną nazwę domeny Blog WordPress. Plik. htaccess zawiera dyrektywy (instrukcje), które informują serwer o zachowaniu się w określonych sytuacjach i bezpośrednio wpływają na funkcjonowanie witryny. Przekierowania i przepisywanie adresów URL to dwie bardzo popularne dyrektywy znalezione w pliku. htaccess, a wiele skryptów takich jak WordPress, Drupal, Joomla i Magento dodaje dyrektywy do pliku. htaccess, aby te skrypty mogły działać. Możliwe, że z jakiegoś powodu będziesz musiał edytować plik. htaccess. Ta sekcja opisuje, jak edytować plik w cPanelu, ale nie w tym, co może wymagać zmiany. (Może zajść potrzeba sprawdzenia innych artykułów i zasoby dla tych informacji.) Istnieje wiele sposobów edycji pliku. htaccess Edytuj plik na komputerze i prześlij go na serwer za pomocą FTP Użyj programów FTP Tryb edycji Użyj SSH i edytora tekstu Użyj Menedżera plików w cPanel Najłatwiej sposób edycji pliku. htaccess dla większości ludzi odbywa się za pomocą Menedżera plików w cPanel. Jak edytować pliki. htaccess w programie cPanels Menedżer plików Zanim podejmiesz jakiekolwiek działania, zaleca się wykonanie kopii zapasowej witryny, aby móc powrócić do poprzedniej wersji, jeśli coś pójdzie nie tak. Otwórz dziennik menedżera plików w cPanel. W sekcji Pliki kliknij ikonę Menedżer plików. Zaznacz pole Katalog główny dokumentów i wybierz nazwę domeny, do której chcesz uzyskać dostęp z menu rozwijanego. Make sure Show Hidden Files (dotfiles) is checked. Kliknij Przejdź. Menedżer plików otworzy się w nowej karcie lub oknie. Poszukaj pliku. htaccess na liście plików. Aby go znaleźć, może być konieczne przewinięcie. Aby edytować plik. htaccess kliknij prawym przyciskiem myszy plik. htaccess i kliknij polecenie Edytuj kod z menu. Możesz także kliknąć ikonę pliku. htaccess, a następnie kliknąć ikonę Edytor kodu u góry strony. Może pojawić się okno dialogowe z pytaniem o kodowanie. Po prostu kliknij Edytuj, aby kontynuować. Edytor otworzy się w nowym oknie. W razie potrzeby edytuj plik. Po zakończeniu kliknij Zapisz zmiany w prawym górnym rogu. Zmiany zostaną zapisane. Przetestuj swoją witrynę, aby upewnić się, że zmiany zostały zapisane. Jeśli nie, popraw błąd lub przywróć poprzednią wersję, dopóki witryna nie będzie działać ponownie. Once complete, you can click Close to close the File Manager window. Introduction. Lecture BigData Analytics. Julian M. Kunkel. 1 Introduction Lecture BigData Analytics Julian M. Kunkel University of Hamburg German Climate Computing Center (DKRZ) 2 Outline 1 Introduction 2 BigData Challenges 3 Analytical Workflow 4 Use Cases 5 Programming 6 Summary Julian M. Kunkel Lecture BigData Analytics, 51 3 About DKRZ German Climate Computing Center (DKRZ) Partner for Climate Research Maximum Compute Performance. Sophisticated Data Management. Competent Service. Julian M. Kunkel Lecture BigData Analytics, 51 4 Introduction BigData Challenges Analytical Workflow Use Cases Programming Summary Scientific Computing Research Group of Prof. Ludwig at the University of Hamburg Embedded into DKRZ Research Analysis of parallel IO Alternative IO interfaces IO amp energy tracing tools Data reduction techniques Middleware optimization Cost amp energy efficiency Julian M. Kunkel Lecture BigData Analytics, 51 5 Lecture Concept of the lecture The lecture is focussing on applying technology and some theory Theory Data models and processing concepts Algorithms and data structures System architectures Statistics and machine learning Applying technology Learning about various state-of-the art technology Hands-on for understanding the key concepts Languages: Java, Python, R The domain of big data is overwhelming, especially in terms of technology It is a crash course for several topics such as statistics and databases it is not the goal to learn and understand every aspect in this lecture Julian M. Kunkel Lecture BigData Analytics, 51 6 Lecture (2) Slides Many openly accessable sources have been used Citation to them by a number The reference slide provides the link to the source For figures, a reference is indicated by Source: Author 1 title ref In the title, an ref means that this reference has been used for the slide, some text may be taken literally Excercise Weekly delivery, processing time about 8 hours per week estimated Teamwork of 2 or 3 people (groups are mandatory) Supported by: Hans Ole Hatzel 1 If available Julian M. Kunkel Lecture BigData Analytics, 51 7 Idea of BigData Methods of obtaining knowledge (Erkenntnissprozess) Theory (model), hypothesis, experiment, analysis (repeat) Explorative: start theory with observations of phenomena Constructivism: starts with axioms and reason implications The Fourth Paradigm (Big) Data Analytics Insight (prediction of the future) For industry: insight business advantage and money. Analytics: follow an explorative approach and study the data To infer knowledge, use statistics machine learning Construct a theory (model) and validate it with the data Julian M. Kunkel Lecture BigData Analytics, 51 8 Example Models Similarity is a (very) simplistic model and predictor for the world Humans use this approach in their cognitive process Uses the advantage of BigData Weather prediction You may develop and rely on complex models of physics Or use a simple model for a particular day e. g. expect it to be similar to the weather of the day over the last X years Used by humans: rule of thumb for farmers Preferences of Humans Identify a set of people which liked items you like Predict you like also the items those people like (items you haven t rated so far) Julian M. Kunkel Lecture BigData Analytics, 51 9 Relevance of Big Data Big Data Analytics is emerging Relevance increases compared to supercomputing Google Search Trends, relative searches Julian M. Kunkel Lecture BigData Analytics, 51 10 1 Introduction 2 BigData Challenges Volume Velocity Variety Veracity Value 3 Analytical Workflow 4 Use Cases 5 Programming 6 Summary Julian M. Kunkel Lecture BigData Analytics, 51 11 BigData Challenges amp Characteristics Source: MarianVesper 4 Julian M. Kunkel Lecture BigData Analytics, 51 12 Volume: The size of the Data What is Big Data Terrabytes to 10s of petabytes What is not Big Data A few gigabytes Examples Wikipedia corpus with history ca. 10 TByte Wikimedia commons ca. 23 TByte Google search index ca. 46 Gigawebpages 2 YouTube per year 76 PByte ( ) 2 3 sumanrs. wordpress20170414youtube-yearly-costs-for-storagenetworking-estimate Julian M. Kunkel Lecture BigData Analytics, 51 13 Velocity: Data Volume per Time What is Big Data 30 KiB to 30 GiB per second (902 GiByear to 902 PiByear) What is not Big Data A never changing data set Examples LHC (Cern) with all experiments about 25 GBs 4 Square Kilometre Array 700 TBs (in 2018) 5 50k Google searches per s 6 Facebook 30 Billion content pieces shared per month blog. kissmetricsfacebook-statistics Julian M. Kunkel Lecture BigData Analytics, 51 14 Data Sources Enterprise data Serves business objectives, well defined Customer information Transactions, e. g. Purchases ExperimentalObservational data (EOD) Created by machines from sensorsdevices Trading systems, satellites Microscopes, video streams, Smart meters Social media Created by humans Messages, posts, blogs, Wikis Julian M. Kunkel Lecture BigData Analytics, 51 15 Variety: Types of Data Structured data Like tables with fixed attributes Traditionally handled by relational databases Unstructured data Usually generated by humans E. g. natural language, voice, Wikipedia, Twitter posts Must be processed into (semi-structured) data to gain value Semi-structured data What is Big Data Has some structure in tags but it changes with documents E. g. HTML, XML, JSON files, server logs Use data from multiple sources and in multiple forms Involve unstructured and semi-structured data Julian M. Kunkel Lecture BigData Analytics, 51 16 Veracity: Trustworthiness of Data What is Big Data Data involves some uncertainty and ambiguities Mistakes can be introduced by humans and machines People sharing accounts Like sth. today, dislike it tomorrorw Wrong system timestamps Data Quality is vital Analytics and conclusions rely on good data quality Garbage data perfect model gt garbage results Perfect data garbage model gt garbage results GIGO paradigm: Garbage In Garbage Out Julian M. Kunkel Lecture BigData Analytics, 51 17 Value of Data What is Big Data Raw data of Big Data is of low value For example, single observations Analytics and theory about the data increases the value Analytics transform big data into smart data Julian M. Kunkel Lecture BigData Analytics, 51 18 Types of Data Analytics and Value of Data 1 Descriptive analytics (Beschreiben) What happened 2 Diagnostic analytics Why did this happen, what went wrong 3 Predictive analytics (Vorhersagen) What will happen 4 Prescriptive analytics (Empfehlen) What should we do and why The level of insight and value of data increases from step 1 to 4 Julian M. Kunkel Lecture BigData Analytics, 51 19 Introduction BigData Challenges Analytical Workflo w Use Cases Programming Summary The Value of Data (alternative view) Source: Dursun Delen, Haluk Demirkan 9 Julian M. Kunkel Lecture BigData Analytics, 51 20 The Value of Data (alternative view 2) Source: Forrester report. Understanding The Business Intelligence Growth Opportunity Julian M. Kunkel Lecture BigData Analytics, 51 21 1 Introduction 2 BigData Challenges 3 Analytical Workflow Value Chain Roles Privacy 4 Use Cases 5 Programming 6 Summary Julian M. Kunkel Lecture BigData Analytics, 51 22 Big Data Analytics Value Chain There are many visualizations of the processing and value chain 8 Source: Andrew Stein 8 Julian M. Kunkel Lecture BigData Analytics, 51 23 Big Data Analytics Value Chain (2) Source: Miller and Mork 7 Julian M. Kunkel Lecture BigData Analytics, 51 24 Roles in the Big Data Business Data scientist Data science is a systematic method dedicated to knowledge discovery via data analysis 1 In business, optimize organizational processes for efficiency In science, analyze experimentalobservational data to derive results Data engineer Data engineering is the domain that develops and provides systems for managing and analyzing big data Build modular and scalable data platforms for data sci entists Deploy big data solutions Julian M. Kunkel Lecture BigData Analytics, 51 25 Typical Skills Data scientist Statistics (Mathematics) Computer science Programming e. g. Java, Python, R, (SAS. ) Machine learning Some domain knowledge for the problem to solve Data engineer Computer science Databases Software engineering Massively parallel processing Real-time processing Languages: C, Java, Python Understand performance factors and limitations of systems Julian M. Kunkel Lecture BigData Analytics, 51 26 Data Science vs. Business Intelligence (BI) Characteristics of BI Provides pre-created dashboards for management Repeated visualization of well known analysis steps Deals with structured data Typically data is generated within the organization Central data storage (vs. multiple data silos) Handeled well by specialized database techniques Typical types of insight Customer service data: what business causes the largest customer wait times Sales and marketing data: which marketing is most effective Operational data: efficiency of the help desk Employee performance data: who is mostleast productive Julian M. Kunkel Lecture BigData Analytics, 51 27 Privacy B e aware of privacy issues if you deal with personalprivate information. German privacy laws are more strict than those of other countries Ziel des Datenschutzes Recht auf informationelle Selbstbestimmung Schutz des Einzelnen vor beeintraumlchtigung des Persoumlnlichkeitsrechts durch den Umgang mit seinen personenbezogenen 8 Daten Besonderer Schutz fuumlr Daten uumlber Gesundheit, ethnische Herkunft, religioumlse, gewerkschaftschliche oder sexuelle Orientierung 8 3 BDSG, Einzelangaben uumlber persoumlnliche oder sachliche Verhaumlltnisse einer bestimmten oder bestimmbaren natuumlrlichen Person Julian M. Kunkel Lecture BigData Analytics, 51 28 Wichtige Grundsaumltze des Gesetzes 10 Verbotsprinzip mit Erlaubsnisvorbehalt Erhebung, Verarbeitung, Nutzung und Weitergabe von personenbezogenen Daten sind verboten Nutzung nur mit Rechtsgrundlage oder mit Zustimmung der Person Unternehmen mit 10 Personen benoumltigen Datenschutzbeauftragten Verfahren zur automatischen Verarbeitung sind vom Datenschutzbeauftragten zu pruumlfen und anzeigepflichtig Sitz der verantwor tlichen Stelle maszliggeblich Bei einer Niederlassung in D gilt BDSG Prinzipien: Datenvermeidung, - sparsamkeit Schutz vor Zugriffen, Aumlnderungen und Weitergabe Betroffene haben Recht auf Auskunft, Loumlschung oder Sperrung AnonymisierungPseudonymisierung: Ist die Zuordnung zu Einzelpersonen (nahezu) ausgeschlossen, so koumlnnen Daten verabeitet werden Julian M. Kunkel Lecture BigData Analytics, 51 29 1 Introduction 2 BigData Challenges 3 Analytical Workflow 4 Use Cases Overview 5 Programming 6 Summary Julian M. Kunkel Lecture BigData Analytics, 51 30 Source: 21 Julian M. Kunkel Lecture BigData Analytics, 51 31 Use Cases for BigData Analytics Increase efficiency of processes and systems Advertisement: Optimize for target audience Product: Acceptance (likedislike) of buyer, dynamic pricing Decrease financial risks: fraud detection, account takeover Insurance policies: Modeling of catastrophes Recommendation engine: Stimulate purchaseconsume Systems: Fault prediction and anomaly dete ction Supply chain management Science Epidemiology research: Google searches indicate Flu spread Personalized Healthcare: Recommend good treatment Physics: Finding the Higgs-Boson, analyze telescope data Enabler for social sciences: Analyze people s mood Julian M. Kunkel Lecture BigData Analytics, 51 32 Big Data in Industry Source: 20 Julian M. Kunkel Lecture BigData Analytics, 51 33 Example Use Case: Deutschland Card 2 Goals Customer bonus card which tracks purchases Increase scalability and flexibility Previous solution based on OLAP Big Data Characteristics Volume: O(10) TB Variety: mostly structured data, schemes are extended steadily Velocity: data growth rate O(100) GB month Results Much better scalability of the solution From dashboards to ad-hoc analysis within minutes Julian M. Kunkel Lecture BigData Analytics, 51 34 Example Use Case: DM 2 Goals Predict required employees per day and store Prevent staff changes on short-notice Big Data Characteristics Results Input data: O pening hours, incoming goods, empl. preferences, holidays, weather. Model: NeuroBayes (Bayes neuronal networks) Predictions: Sales, employee planning predictions per week Daily updated sales per store Reliable predictions for staff planning Customer and employee satisfaction Julian M. Kunkel Lecture BigData Analytics, 51 35 Example Use Case: OTTO 2 Goals Optimize inventory and prevent out-of-stock situations Big Data Characteristics Input data: product characteristics, advertisement VolumeVelocity: 135 GBweek, 300 million records Model: NeuroBayes (Bayes neuronal networks) 1 billion predictions per year Results Better prognostics of product sales (up to 40) Real time data analytics Julian M. Kunkel Lecture BigData Analytics, 51 36 Example Use Case: Smarter Cities (by KTH) 2 Goals Improve traffic management in Stockholm Prediction of alternative routes Big Data Characteristics Input data: Traffic videossensors, weather, GPS VolumeVelocity: 250k GPS-datas other data sources Results 20 less traffic 50 reduction in travel time 20 less emissions Julian M. Kunkel Lecture BigData Analytics, 51 37 Example Facebook Studies Insight from 11 by exploring posts Young narcissists tweet more likely. Middle-aged narcissists update their status US students post more problematic information than German students US Government checks tweetsfacebook messages for several reasons Human communication graph has an average diameter of 4.74 Manipulation of news feeds 13 News feeds have been changed to analysis people s behavior in subsequent posts Paper: Experimental evidence of massive-scale emotional contagion through social networks Julian M. Kunkel Lecture BigData Analytics, 51 38 From Big Data to the Data Lake 20 With cheap storage costs, people promote the concept of the data lake Combines data from many sources and of any type Allows for conducting future analysis and not miss any opportunity Attributes of the data lake Collect everything: all data, both raw sources over extended periods of time as well as any processed data Decide during analysis which data is important, e. g. no schema until read Dive in anywhere: enable users across multiple business units to refine, explore and enrich data on their terms Flexible access: enable multiple data access patterns across a shared infrastructure: batch, interactive, online, search, and others Julian M. Kunkel Lecture BigData Analytics, 51 39 1 Introduction 2 BigData Challenges 3 Analytical Workflow 4 Use Cases 5 Programming Java Python R 6 Summary Julian M. Kunkel Lecture BigData Analytics, 51 40 Programming BigData Analytics High-level concepts SQL and derivatives Domain-specific languages (Cypher, PigLatin) Programming languages Java interfaces are widely available but low-level Python and R have connectors to popular BigData solutions In the exercises, we ll learn and use basics of those languagesinterfaces Julian M. Kunkel Lecture BigData Analytics, 51 41 Introduction to Java Developed by Sun Microsystems in 1995 Object oriented programming language OpenJDK implementation is open source Source code byte co de just-in-time compiler Byte code is portable amp platform independent Virtual machine abstracts from systems Strong and static type system Popular language for Enterprise amp Big Data applications Most popular programming language (Pos. 1 on the TIOBE index) Development tools: Eclipse Specialties Good runtime and compile time error reporting Generic data types (vs. templates of C) Introspection via. Reflection Julian M. Kunkel Lecture BigData Analytics, 51 44 Introduction to Python Open source Position 5 on TIOBE index Interpreted language Weak type system (errors at runtime) Development tools: any editor, interactive shell Note: Use and learn python3 explicitly Recommended plotting library: matplotlib 9 Specialties Strong text processing Simple to use Support for object oriented programming Indentation is relevant for code blocks 9 Julian M. Kunkel Lecture BigData Analytics, 51 45 Example Python Program 1 binenv python 2 import re use the module re 3 4 function reading a file 5 def readfile(filename): 6 with open(filename, r ) as f: 7 data f. readlines() 8 f. close() 9 return data 10 return return an empty arraylist the main function 13 if name quot main quot: 14 data readfile( intro. py ) 15 iterate over the array 16 for x in data: 17 extract imports from a python file using a regex 18 m re. match(quotimport t(pltwhatgt )quot, x) 19 if m: 20 print(m. group(quotwhatquot)) 21 dictionary (key value pair) 22 dic m. groupdict() 23 dic. update( ) append a new dict. with one key 24 use format string with dictionary 25 print(quotfound import (WHAT)s in file (FILE)squot dic ) 26 Prints: Found import re in file intro. py Julian M. Kunkel Lecture BigData Analytics, 51 46 Example Python Classes 1 from abc import abstractmethod 2 3 class Animal(): 4 constructor, self are instance methods, else class methods 5 def init (self, weight): 6 self. weight weight private variables start with 7 8 decorator 10 def name(self): 11 return self. class. name reflection like def str (self): 14 return quotI m a s with weight fquot (self. name(), self. weight) class Rabbit(Animal): 17 def init (self): 18 super() is available with python 3 19 super(). init (2.5) def name(self): 22 return quotSmall Rabbitquot override name if name quot main quot: 25 r Rabbit() 26 print(r) print: I m a Small Rabbit with weight Julian M. Kunkel Lecture BigData Analytics, 51 47 Introduction to R Based on S language for statisticians Open source Position 19 on TIOBE index Interpreter with C modules (packages) Easy installation of packages via CRAN 10 Popular language for data analytics Development tools: RStudio (or any editor), interactive shell Recommended plotting library: ggplot2 11 Specialties Vectormatrix operations. Note: Loops are slow, so avoid them Table data structure (data frames) 10 Comprehensive R Archive Network 11 Julian M. Kunkel Lecture BigData Analytics, 51 48 Course for Learning R Programming 1 Run with quotRscript intro. rquot or run quotRquot and copyamppaste into interactive shell 2 Installing a new package is as easy as: 3 install. packages(quotswirlquot) 4 Note: sometimes packages are not available on all mirrors 5 library(swirl) load the package 6 7 help(swirl) read help about the function swirl swirl() start an interactive course to learn R 11 a simple for loop 12 for (x in 1:10) else 18 Julian M. Kunkel Lecture BigData Analytics, 51 49 Example R Program 1 create an array 2 x c(1, 2, 10:12) 3 4 apply an operator on the full vector and output it 5 print( x2 ) prints: slice arrays 8 print ( x3:5 ) prints: print( xc(1,4,8) ) prints: 1 11 NA r runif(100, min0, max100) create array with random numbers 12 m matrix(r, ncol4, byrow TRUE) create a matrix slice matri x rows quotmrow(s), column(s)quot 15 print( m10:12, ) Output: 16 ,1 ,2 ,3 ,4 17 1, 2, 3, slice rows amp columns 22 print ( m10, c(1,4) ) Output: 1 subset the table based on a mask 25 set m (m,1 lt 20 amp m,2 gt 2), Julian M. Kunkel Lecture BigData Analytics, 51 51 Summary Big data analytics Explore data and model causalities to gain knowledge amp value Challenges: 5 Vs Volume, velocity, variety, veracity, value Data sources: Enterprise, humans, Exp. Observational data (EOD) Types of data: Structured, unstructured and semi-structured Levels of analytics: Descriptive, predictive and prescriptive Roles in big data business: Data scientist and engineer Data science business intelligence Julian M. Kunkel Lecture BigData Analytics, 51 52 Bibliography 1 Book: Lillian Pierson. Data Science for Dummies. John Wiley amp Sons 2 Report: Juumlrgen Urbanski et. al. Big Data im Praxiseinsatz Szenarien, Beispiele, Effekte. BITKOM 3 4 Forrester Big Data Webinar. Holger Kisker, Martha Bennet. Big Data: Gold Rush Or Illusion Gilbert Miller, Peter Mork From Data to Decisions: A Value Chain for Big Data. 8 Andrew Stein. The Analytics Value Chain. 9 Dursun Delen, Haluk Demirkan. Decision Support Systems, Data, information and analytics as services. j.mp11bl9b9 10 Wikipedia 11 Kashmir Hill. 46 Things We ve Learned From Facebook Studies. Forbe. 12 Hortonworks Julian M. Kunkel Lecture BigData Analytics, 51

