Hurtownia danych - co to jest i jak działa? Porównanie z relacyjną bazą danych sql

  Рет қаралды 13,173

nieinformatyk

nieinformatyk

Күн бұрын

🎁 ODBIERZ PREZENT - promo.plsql.pl/
✅Czym jest hurtownia danych i czym różni się hurtownia danych od bazy danych? W dzisiejszym nagraniu zrozumiesz cel tworzenia hurtowni danych oraz zasadnicze różnice między przetwarzaniem olap i oltp. Zapraszam do oglądania.
== 🔗 Przydatne linki z nagrania:==
🏷️Do czego używa się baz danych: • Jak zacząć naukę progr...
🏷️normalizacja baz danych: • Na czym polega normali...
🏷️jak działa indeks w bazie danych: • Indeks w bazie danych ...
🏷️co to jest proces ETL: • Co to jest ETL, czyli ...
🏷️proces ETL w praktyce: • Migracja danych z bazy...
🏷️hurtownia snowflake: www.snowflake.com/
🏷️dokumentacja oracle partycjonowanie: docs.oracle.com/en/database/o...
== 👌 Polecam obejrzeć:==
1. Co to jest proces ETL: • Co to jest ETL, czyli ...
2. Jak działa indeks w bazie danych: • Indeks w bazie danych ...
== ⏱️ Plan odcinka:==
00:00 start
00:09 start odcinka
01:17 na czym polega transakcyjne przetwarzanie danych w bazie?
02:51 na czym polega przetwarzanie analityczne w bazie danych?
06:11 co to jest hurtownia danych
07:19 różnica między bazą danych a hurtownią danych
18:00 minus hurtowni
19:28 podsumowanie
#bazodanowiec
== 👨‍💻 Poznaj mniej lepiej:==
* Moja strona: www.nieinformatyk.pl/
* Kod z odcinka: www.nieinformatyk.pl/pliki
* Facebook: / nieinformatyk
* Linkedin: / darekbutkiewicz
* Instagram: / nieinformatyk
* Twitter: / nieinformatyk
Zasubskrybuj mój kanał: kzfaq.info...
🏁 Witaj na moim kanale :)
Jestem programistą baz danych Oracle oraz developerem hurtownii danych (ETL). W tym miejscu dzielę się z oglądającymi wiedzą dotyczącą relacyjnych baz danych, praktycznych technik pisania SQL oraz optymalizacji kodu PL/SQL. Jeśli chcesz zdobyć praktyczną i rzetelną więdzę o bazach danych to trafiłeś na właściwe miejsce.
🚨 Więcej informacji o bazach danych znajdziesz zupełnie ZA DARMO na www.nieinformatyk.pl i nieinformatyk.pl/strona/plsql...
📧 Masz pytanie, prośbę, sugestię? Pisz śmiało na kontakt@nieinformatyk.pl

Пікірлер: 48
@adrreb
@adrreb Жыл бұрын
Bardzo dziękuję jak zawsze dużo cennej praktycznej wiedzy i mnóstwo pozytywnej energii! Pozdrawiam!
@nieinformatyk
@nieinformatyk Жыл бұрын
dzięki :)
@WronaMW
@WronaMW Жыл бұрын
Super!
@TrollStefan
@TrollStefan 2 жыл бұрын
Dzięki za materiał. Czekam na poprawiony odcinek o normalizacji.
@merktor2090
@merktor2090 3 жыл бұрын
Dzięki za kolejny filmik.
@nieinformatyk
@nieinformatyk 3 жыл бұрын
Merktor - bijesz rekordy komentarzy, dzięki :)
@Mells
@Mells 3 жыл бұрын
Dziękuję za to co robisz! Nikt tak nie tłumaczy jak ty 😍😍
@nieinformatyk
@nieinformatyk 3 жыл бұрын
Dziękuję :) Cieszę się, że odcinek się podobał.
@mrgvp
@mrgvp 3 жыл бұрын
Super odcinek! Dzięki!!
@nieinformatyk
@nieinformatyk 3 жыл бұрын
Polecam się na przyszłość :)
@specialmusic3498
@specialmusic3498 3 жыл бұрын
Wartościowy materiał. Pozdrawiam Serdecznie.
@nieinformatyk
@nieinformatyk 3 жыл бұрын
Dziękuję :)
@MsMalcolmX
@MsMalcolmX 3 жыл бұрын
Kolejny dobry materiał :) Oby tak dalej Darku ;)
@nieinformatyk
@nieinformatyk 3 жыл бұрын
Dzięki Bartek :)
@adrreb
@adrreb Жыл бұрын
Kolejny interesujący materiał przedstawiony w przyjemny sposób 👍
@nieinformatyk
@nieinformatyk Жыл бұрын
dzięki :)
@sebon11
@sebon11 Жыл бұрын
Super odcinek jak zawsze, pozdro
@nieinformatyk
@nieinformatyk Жыл бұрын
dzięki :)
@Yolkenable
@Yolkenable 2 жыл бұрын
Daję subscribe i zostaję na dłużej ❤
@nieinformatyk
@nieinformatyk 2 жыл бұрын
dzięki :)
@piotrmazgaj
@piotrmazgaj Жыл бұрын
Przydatne.
@nieinformatyk
@nieinformatyk Жыл бұрын
dziękuję ;)
@jacekkangaroo4402
@jacekkangaroo4402 2 жыл бұрын
w transakcyjnych bazach danych bardzo dobrze jest stosować partycje aby: - poprawić wyszukiwanie danych na potrzeby reklamacji klienta, najczęściej z kilku ostatnich dni, tygodni, - zabezpieczyć dane przed przypadkowymi modyfikacjami, starsze partycje można przełączyć w tryb tylko do odczytu i żaden proces już nie nadpisze istniejących danych, - wykonywać przyrostową archiwizację danych, tak wiem są jeszcze inne metody ale ta jest także stosowana, - szybko odtworzyć bazę danych po awarii, gdy odtwarzamy najpierw najnowsze dane z najnowszych partycji aby jak najszybciej przywrócić system do życia, archiwalne partycje można przywrócić póżniej jeśli to konieczne, a czasami nie jest to nawet konieczne, - usuwać dane archiwalne sprzed roku lub więcej, zamiast czasochłonnego i obciążającego system DELETE, odłączamy całe partycje, co działa znacznie sprawniej, oczywiście w Oracle, bo w mikrosyfie partycje to porażka, jak i cała baza
@nieinformatyk
@nieinformatyk 2 жыл бұрын
Zgadzam się co do opisanych wyżej korzyści, tyle, że w modelowej transakcyjnej bazie danych nie przechowujemy danych historycznych, a jeśli tak to niewielki jej zakres. Równie dobrze można przechowywać dane w oddzielnej tabeli: arch_nazwa_tabeli, która będzie miała dedykowany TBS read only :) Ile projektów tyle rozwiązań. Wiem, że rzeczywistość jest dużo bardziej złożona niż opisuje w niektórych filmach, ale: 1. Odcinek może trwać kilkanaście minut by chciał go ktoś oglądać i nie o wszystkim zdążę powiedzieć 2. postaw się na miejscu osoby, która dopiero stawia pierwsze kroki i nie ma żadnego doświadczenia z hurtownią danych. Gdybym w tym nagraniu zaczął mówić o tym, że w OLTP też mamy historię, też tworzymy archiwum zmian danych to pojawiły się pytania - czym się różni baza od hurtownii w tym kontekście. Odcinek nagrywałem już ponad rok temu, ale wydaje mi się, że wspominałem na samym końcu, że taka sytuacja może zaistnieć(archiwalne dane w bazie danych). A wtedy partycjonowanie i inne techniki wykorzystywane w dwh też mają przy OLTP zastosowanie jak słusznie zauważyłeś.
@jacekkangaroo4402
@jacekkangaroo4402 2 жыл бұрын
@@nieinformatyk "w modelowej transakcyjnej bazie danych nie przechowujemy danych historycznych, a jeśli tak to niewielki jej zakres" - i tu jesteś w błędzie, bardzo wiele firm przechowuje dane historyczne w relacyjnych bazach danych, chociażby z tego powodu, że nie posiada hurtowni danych, np. bo nie ma takiej potrzeby, bo jest dla nich za droga, gdy skala ich biznesów nie jest tak duża aby wydawać pierdyliard złotówek na budowę i utrzymanie hurtowni danych
@nieinformatyk
@nieinformatyk 2 жыл бұрын
@@jacekkangaroo4402 ale to niczego nie zmienia z punktu widzenia teorii - modelowa baza transakcyjna nie przechowuje historii. O tym, że rzeczywistość wygląda inaczej mówiłem pod koniec nagrania - baza danych to często OLTP + trochę OLAP.
@MeggaFelipe
@MeggaFelipe 3 жыл бұрын
#zasieg
@nieinformatyk
@nieinformatyk 3 жыл бұрын
Dzięki :)
@JanUnitra
@JanUnitra 2 жыл бұрын
zastanawia mnie denormalizacja w Data Warehouse, jak bardzo dane powinny byc zdenormalizowane ?
@nieinformatyk
@nieinformatyk 2 жыл бұрын
A to zależy, temat rzeka - poczytać o modelu Inmona, Kimballa, Data Vault, Data Vault 2.0 :)
@JanUnitra
@JanUnitra 2 жыл бұрын
@@nieinformatyk dzięki, poczytam
@JanUnitra
@JanUnitra 2 жыл бұрын
@@nieinformatyk widzę, że w DW używane są star, snoflake, Galaxy schematy, czyli to nie jest błędem?
@nieinformatyk
@nieinformatyk 2 жыл бұрын
@@JanUnitra czemu błędem? model gwiazdy czy płatka śniegu to jedne z kilku podejść architektonicznych do budowy DWH
@jacekkangaroo4402
@jacekkangaroo4402 2 жыл бұрын
mając tabelę pokazującą aktualny stan magazynowy nie potrzebujesz indeksu na kolumnie 'number of items', wystarczy ci tylko indeks na kolumnie 'product code', także aktualizacja stanu magazynowego nie wymaga aktualizacji dodatkowego indeksu na tabeli, to tak w skrócie bez wdawania się w szczegóły, przykład do filmu nieco nietrafiony
@nieinformatyk
@nieinformatyk 2 жыл бұрын
Nie pamiętam jakiego przykładu użyłem w nagraniu, więc albo ja się pomyliłem, albo Ty mnie źle zrozumiałeś :) Jeśli chcemy czytać stan magazynowy produktów to oczywiście tak jak piszesz wystarczy indeks na kolumnie z id_produktu(+ ewentualnie data zasilania/obowiązywania danych). Indeks podlegałby wtedy aktualizacji w przypadku UPDAT-e na kluczu głównym(zmiana id_produktu).
@jacekkangaroo4402
@jacekkangaroo4402 2 жыл бұрын
@@nieinformatyk 11:55 "chcąc modyfikować dane w tabeli, np. stan magazynowy, jednocześnie musiałbym zmodyfikować index" - zwykle szukamy produktu przy użyciu indeksu kod produktu, a następnie w tabeli jego atrybutów, np. stan na magazynie (dwie operacje odczytu z bazy, raz index (index też jest tabelą i wymaga osobnej operacji odczytu), drugi raz tabela), ale są przypadki gdy chcemy przyścieszyć działanie odczytu i wtedy umieszczamy taką kolumnę w indeksie, wtedy faktycznie mamy nieco większy koszt w czasie modyfikacji rekordu, ale skracamy czas odczytu gdy nam na tym zależy (wszystko liczone w milisekundach także dla tysięcy transakcji na godzinę bez znaczenia, dopiero przy masowym przetwarzaniu w setkach milionów na godzinę ma znaczenie), bardzo przydatna funkcja w masowym przetwarzaniu danych, szczególnie gdy mamy chained rows w Oracle i nie możemy sobie pozwolić na przebudowę tabeli, ale to już inna historia, a tak na marginesie, to tabela stan magazynowy jest tabelą raportową, wyliczaną na podstawie dokumentów magazynowych (przyjęto na magazyn, zwrócono do magazynu, protokół zniszczenia, przeniesienia magazynowe, zamówienia klientów itp.), tworzymy takie tabele aby za każdym razem nie przeszukiwać ogromnej tabeli z dokumentami magazynowymi w celu potwierdzenia ilości towaru dostępnego do sprzedaży, a gdy nam się taka tabela rozleci, zawsze możemy ją odtworzyć z danych źródłowych, i na kolejnym marginesie, za updatey na kluczu głównym obcinałbym ręce, potem jeszcze obdzierał ze skóry, posypywał solą i na koniec zostawił aby samo zdechło :-)
@TomaszTomzik
@TomaszTomzik 2 жыл бұрын
Wydaje mi się, że nie do końca wskazałeś, dlaczego osobnym schematem lub tablespejsem lub nawet tabelą nie da się zrealizować wszystkiego co można zrobić w specjalistycznej instancji hurtowni bazy danych. Powiedziałeś, że ciężko albo się nie da, ale bez konkretnego przypadku/przyczyny.
@nieinformatyk
@nieinformatyk 2 жыл бұрын
Pytanie może i jest proste, ale moja odpowiedź by była zrozumiała musiałaby być bardzo długa->temat na oddzielne nagranie :) To trochę jakby próbować z auta sportowego zrobić dostawczak lub na odwrót.
@TomaszTomzik
@TomaszTomzik 2 жыл бұрын
@@nieinformatyk ja rozumiem, ale mogły paść dwa, trzy proste przykłady - jeśli coś jest trudne w wytłumaczeniu w 2 zdaniach znaczy się, że temat nie jest do końca zrozumiały dla samego prelegenta.;)
@jacekkangaroo4402
@jacekkangaroo4402 2 жыл бұрын
przykład pracownika jest bardzo nietrafiony, przede wszystkim dlatego że zmiany stanowiska nie są operacjami masowymi (masowa to jest sprzedaż w markecie, połączenia w telekomie, operacje bankowe), ponad to ze względów prawnych w systemie kadrowym powinna znajdować się cała historia zatrudnienia pracownika, wyszukanie aktualnego/historycznego stanowiska pracownika w bazie nawet tysięcy pracowników nie stanowi dla bazy danych żadnego problemu, przekombinowałeś tutaj
@adrreb
@adrreb Жыл бұрын
Jakież to polskie... Niesamowicie łatwo jest ponarzekać, a tak trudno zrobić coś pożytecznego. Jeżeli nawet dostrzegasz jakieś niedociągnięcia, mogłeś napisać jakiś konstruktywny przykład żeby uzupełnić materiał, ale oczywiście łatwiej tylko marudzić i narzekać. A jakbyś się tak lepiej zastanowił to ten przykład z pracownikami miał coś na szybko zobrazować, może nie jest najlepszy ale napewno jest wystarczający, aby zrozumieć istotę tematu. Panie Darku dziękuję w imieniu Jacka Kangaroo i wszystkich innych maruderów. Trzymaj się ciepło Panie Darku 👍😊
@jacekkangaroo4402
@jacekkangaroo4402 Жыл бұрын
@@adrreb podawanie niepoprawnych przykładów jest szkodliwe, może wykształcić w młodzikach złe wzorce, które będą powodować problemy w przyszłości, dlatego zwróciłem na to uwagę aby narybek poznał także inny punkt widzenia, także nie napinaj się jak gumka w majtkach i poluzuj warkoczyk, moja opinia nie wynikała z hejtu
@adrreb
@adrreb Жыл бұрын
@@jacekkangaroo4402 Może twoja wyobraźnia nie ogarnia takich możliwości ale na ten przykład ja pracuję w ogromnej korporacji w której fluktuacja pracowników (na którą zarząd daje zgodę) jest bardzo duża i tego typu przykład jest jak najbardziej adekwatny.
@jacekkangaroo4402
@jacekkangaroo4402 Жыл бұрын
@@adrreb duża baza danych to pojęcie względne, znałem nie jednego gościa co bazę 100 milionów rekordów (i to jeszcze utrzymywaną w majkrosyfie) nazywał bardzo dużą (takiej rotacji pracowników na pewno nie masz nawet przez cały rok)... ja pracowałem w firmach gdzie ładowane pliki danych miały 50-100 milionów rekordów, a zamknięcie miesiąca obejmowało przetworzenie ponad 2 miliarów rekrodów i generowało kolejne kilkaset milionów... optymalizowałem taki proces z 36 godzin do poniżej 24h a jakby posiedzieć dłużej to pewnie jeszcze coś bym urwał ale klient był już zadowolony z takiego postępu
@MrFemex
@MrFemex 3 жыл бұрын
Wyjątek potwierdzający regułę znaczy totalnie nie to co powiedziałeś :C
@nieinformatyk
@nieinformatyk 3 жыл бұрын
Jaki wyjątek?
@MrFemex
@MrFemex 3 жыл бұрын
@@nieinformatyk Coś powiedziałeś że "wyjątek potwierdzający regułę" w ramach żartu, ale no, nie tak się tego sformułowania używa
@nieinformatyk
@nieinformatyk 3 жыл бұрын
@@MrFemex Musiałbyś wskazać konkretny fragment nagrania, bo dalej nie wiem gdzie popełniłem błąd :)
Transakcja sql - to co jest i jak działa w bazie danych?
18:47
nieinformatyk
Рет қаралды 10 М.
ОСКАР vs БАДАБУМЧИК БОЙ!  УВЕЗЛИ на СКОРОЙ!
13:45
Бадабумчик
Рет қаралды 3,9 МЛН
OMG🤪 #tiktok #shorts #potapova_blog
00:50
Potapova_blog
Рет қаралды 18 МЛН
THE POLICE TAKES ME! feat @PANDAGIRLOFFICIAL #shorts
00:31
PANDA BOI
Рет қаралды 24 МЛН
Happy 4th of July 😂
00:12
Pink Shirt Girl
Рет қаралды 42 МЛН
Czym jest relacyjna baza danych? Baza danych SQL cz 1
8:26
Lubię Programować
Рет қаралды 543
Na czym polega normalizacja w bazach danych? #65
12:55
nieinformatyk
Рет қаралды 24 М.
Co to jest i jak działa kursor w bazie danych?
25:58
nieinformatyk
Рет қаралды 9 М.
Poziomy izolacji sql - wyjaśnienie dla laika + przykłady
27:36
nieinformatyk
Рет қаралды 3,6 М.
Co to jest Business Intelligence? - Podcast: #170
8:51
Michał Kowalczyk - Excellent Work
Рет қаралды 2 М.
SQL vs noSQL | MySQL vs MongoDB - różnice
17:19
Twórca Stron
Рет қаралды 24 М.
Odc 22: Dlaczego warto znać nierelacyjne bazy danych nosql?
15:18
nieinformatyk
Рет қаралды 5 М.
WATERPROOF RATED IP-69🌧️#oppo #oppof27pro#oppoindia
0:10
Fivestar Mobile
Рет қаралды 17 МЛН
ИГРОВОВЫЙ НОУТ ASUS ЗА 57 тысяч
25:33
Ремонтяш
Рет қаралды 344 М.
Simple maintenance. #leddisplay #ledscreen #ledwall #ledmodule #ledinstallation
0:19
LED Screen Factory-EagerLED
Рет қаралды 26 МЛН
When you have 32GB RAM in your PC
0:12
Deadrig Gaming
Рет қаралды 2,5 МЛН
1$ vs 500$ ВИРТУАЛЬНАЯ РЕАЛЬНОСТЬ !
23:20
GoldenBurst
Рет қаралды 1,6 МЛН