Online analytisk prosessering, eller OLAP, er en effektiv databehandleteknologi, som et resultat av, basert på enorme matriser av alle slags data, vises den endelige informasjonen. Dette er et kraftig produkt som hjelper deg med å få tilgang til, hente og se informasjon på en PC, analysere den fra forskjellige synsvinkler.
OLAP er et verktøy som gir en strategisk posisjon for langsiktig planlegging og vurderer grunnleggende informasjon om driftsdata for et perspektiv på 5, 10 eller flere år. Data lagres i databasen med dimensjonen, som er deres attributt. Brukere kan se det samme datasettet med forskjellige attributter, avhengig av formålet med analysen.
OLAP Historie
OLAP er ikke et nytt konsept og har blitt brukt i flere tiår. Teknologiens opprinnelse er faktisk sporet tilbake til 1962. Men begrepet ble myntet først i 1993 av databaseforfatteren Ted Coddom, som også satte 12 regler for produktet. Som i mange andre bruksområder har konseptet gjennomgått flere stadier av evolusjon.
Historien til OLAP-teknologien stammer selv fra 1970, da Express-informasjonsressurser og den første Olap-serveren ble utgitt. De ble anskaffet av Oracle i 1995 og ble deretter grunnlaget for den online analytiske behandlingen av den flerdimensjonale datamekanismen som det anerkjente datamaskinmerket ga i sin database. I 1992 ble et annet kjent online analytisk prosesseringsprodukt Essbase utgitt av Arbor Software (kjøpt av Oracle i 2007).
I 1998 lanserte Microsoft den online databehandlingsserveren MS Analyse Services. Dette bidro til populariteten til teknologi og fikk utviklingen av andre produkter. I dag er det flere verdenskjente leverandører som tilbyr Olap-applikasjoner, inkludert IBM, SAS, SAP, Essbase, Microsoft, Oracle, IcCube.
Online analytisk prosessering
OLAP er et verktøy som lar deg ta beslutninger om planlagte arrangementer. Atypisk Olap-beregning kan være mer komplisert enn bare å samle data. Analytiske spørringer per minutt (AQM) brukes som en standardreferanse for å sammenligne ytelsen til forskjellige instrumenter. Disse systemene skal skjule brukere så mye som mulig for syntaks av komplekse spørringer og gi en jevn responstid for alle (uansett hvor kompliserte de er).
Følgende sentrale funksjoner i OLAP finnes:
- Flerdimensjonale datarepresentasjoner.
- Støtte for kompleks databehandling.
- Midlertidig etterretning.
Flerdimensjonal presentasjon gir grunnlag for analytisk behandling gjennom fleksibel tilgang til bedriftsdata. Det gjør det mulig for brukere å analysere data i alle dimensjoner og på hvilket som helst nivå av aggregering.
Støtte for kompleks databehandling er grunnlaget for OLAP-programvare.
Midlertidig intelligens brukes til å evaluere effektiviteten til enhver analytisk applikasjon over en bestemt tidsperiode. For eksempel denne måneden sammenlignet med forrige måned, denne måneden sammenlignet med samme måned i fjor.
Flerdimensjonal datastruktur
En av hovedegenskapene ved online analytisk prosessering er den flerdimensjonale datastrukturen. En kube kan ha flere dimensjoner. Takket være denne modellen er hele prosessen med intelligent analyse av OLAP enkel for ledere og ledere, siden objektene som er representert i cellene er virkelige forretningsobjekter. I tillegg tillater denne datamodellen brukere å behandle ikke bare strukturerte matriser, men også ustrukturerte og semistrukturerte.Alt dette gjør dem spesielt populære for dataanalyse og BI-applikasjoner.
Viktige funksjoner i OLAP Systems:
- Bruk flerdimensjonale dataanalysemetoder.
- Gi avansert databasestøtte.
- Lag brukervennlige sluttbrukergrensesnitt.
- Støtt klient / serverarkitektur.
En av hovedkomponentene i OLAP-konsepter er en server på klientsiden. I tillegg til å aggregere og forhåndsbehandle data fra en relasjonsdatabase, gir den avanserte beregnings- og registreringsparametere, tilleggsfunksjoner, grunnleggende avanserte spørringsfunksjoner og andre funksjoner.
Avhengig av eksempelapplikasjonen som er valgt av brukeren, er forskjellige datamodeller og verktøy tilgjengelige, inkludert sanntidsvarsler, en funksjon for å bruke hva-hvis-scenarier, optimalisering og komplekse OLAP-rapporter.
Kubisk form
Konseptet er basert på en kubisk form. Plasseringen av dataene i den viser hvordan OLAP overholder prinsippet om multivariat analyse, som et resultat av det blir laget en datastruktur for rask og effektiv analyse.
En OLAP-kube kalles også en "hypercube." Det beskrives som bestående av numeriske fakta (tiltak), klassifisert etter fasetter (dimensjoner). Dimensjoner forholder seg til attributter som definerer et forretningsproblem. Enkelt sagt er en dimensjon en etikett som beskriver et mål. For eksempel i salgsrapporter vil tiltaket være salgsvolum, og dimensjoner vil omfatte perioden med salg, selgere, et produkt eller en tjeneste og salgsområdet. I rapporteringen av produksjonsoperasjoner kan tiltaket være totale produksjonskostnader og produksjonsenheter. Dimensjoner vil være dato eller klokkeslett for produksjon, produksjonsfase eller fase, til og med arbeiderne som er involvert i produksjonsprosessen.
OLAP-datakuben er hjørnesteinen i systemet. Dataene i kuben er organisert ved bruk av enten et stjerne- eller snøfnuggmønster. I sentrum er det en faktatabell som inneholder aggregater (tiltak). Det er assosiert med en serie måltabeller som inneholder informasjon om tiltak. Dimensjoner beskriver hvordan disse tiltakene kan analyseres. Hvis en kube inneholder mer enn tre dimensjoner, kalles den ofte en hyperkube.
En av hovedfunksjonene som tilhører kuben er dens statiske natur, noe som innebærer at kuben ikke kan endres etter dens utvikling. Derfor er prosessen med å bygge en kube og sette opp en datamodell et viktig skritt mot passende databehandling i OLAP-arkitekturen.
Datasamling
Bruk av aggregasjoner er hovedårsaken til at forespørsler blir behandlet mye raskere i OLAP-verktøy (sammenlignet med OLTP). Aggregasjoner er sammendrag av data som tidligere ble beregnet under behandlingen. Alle medlemmer som er lagret i OLAP-dimensjonstabeller definerer spørsmålene som kuben kan motta.
I en kube blir informasjonsakkumuleringer lagret i celler, hvis koordinater er spesifisert av spesifikke størrelser. Antall aggregater som en kube kan inneholde avhenger av alle mulige kombinasjoner av dimensjonselementer. Derfor kan en typisk kube i en applikasjon inneholde et ekstremt stort antall aggregater. En foreløpig beregning vil bare bli utført for nøkkelaggregater som er distribuert over den analytiske kuben til online analyse. Dette vil redusere tiden som kreves for å bestemme eventuelle aggregeringer betydelig når du utfører en spørring i en datamodell.
Det er også to alternativer relatert til aggregeringer som du kan forbedre ytelsen til en ferdig kube: lage en samling av kapasitetsbufferen og bruke aggregering basert på en analyse av brukerforespørsler.
Arbeidsprinsipp
Vanligvis kan analysen av operativ informasjon hentet fra transaksjoner utføres ved hjelp av et enkelt regneark (dataverdiene presenteres i rader og kolonner). Dette er bra gitt den todimensjonale naturen til dataene. Når det gjelder OLAP er det forskjeller på grunn av den flerdimensjonale datasamlingen.Fordi de ofte er hentet fra forskjellige kilder, er det ikke sikkert at et regneark kan behandle dem effektivt.
Kuben løser dette problemet og sikrer også at OLAP-datavarehuset fungerer på en logisk og ordnet måte. Virksomheten samler inn data fra en rekke kilder og presenteres i forskjellige formater som tekstfiler, multimediefiler, Excel-regneark, Access-databaser og til og med OLTP-databaser.
All data blir samlet i et depot fylt direkte fra kilder. I den vil den rå informasjonen som er mottatt fra OLTP og andre kilder bli slettet for feilaktige, ufullstendige og inkonsekvente transaksjoner.
Etter rengjøring og konvertering, blir informasjonen lagret i en relasjonsdatabase. Deretter blir den lastet opp til den flerdimensjonale OLAP-serveren (eller Olap-kuben) for analyse. Sluttbrukere som er ansvarlige for forretningsapplikasjoner, data mining og annen forretningsdrift vil få tilgang til informasjonen de trenger fra Olap-kuben.
Fordeler med arraymodell
OLAP er et verktøy som gir rask spørringsytelse, som oppnås gjennom optimalisert lagring, flerdimensjonal indeksering og hurtigbufring, som er viktige fordeler med systemet. I tillegg er fordelene:
- Mindre data på disken.
- Automatisk beregning av aggregater av et høyere datanivå.
- Array-modeller gir naturlig indeksering.
- Effektiv innhenting av data oppnås gjennom forhåndsstrukturering.
- Kompakt for lavdimensjonale datasett.
Ulempene med OLAP inkluderer det faktum at noen løsninger (behandlingstrinn) kan være ganske lange, spesielt med store mengder informasjon. Dette korrigeres vanligvis ved bare å utføre inkrementell behandling (data som er modifisert blir studert).
Grunnleggende analytiske operasjoner
konvolusjon (roll-up / drill-up) er også kjent som "konsolidering". Koagulering innebærer å samle inn alle dataene som kan fås, og beregne alle i en eller flere dimensjoner. Oftest kan dette kreve bruk av en matematisk formel. Som et OLAP-eksempel kan vi vurdere et detaljhandelsnettverk med utsalgssteder i forskjellige byer. For å identifisere modeller og forutse fremtidige salgstrender, blir data om dem fra alle punkter "kollapset" til selskapets viktigste salgsavdeling for konsolidering og beregning.
avsløring (Drill-ned). Dette er motsatt av koagulering. Prosessen starter med et stort datasett og bryter deretter opp i mindre deler, og lar brukerne se detaljer. I detaljhandelnettverket vil analytikeren analysere salgsdata og se på enkeltmerker eller produkter som regnes som bestselgere i hvert av utsalgene i forskjellige byer.
seksjon (Skive og terning). Dette er en prosess når analytiske operasjoner inkluderer to handlinger: utlede et spesifikt datasett fra OLAP-kuben ("kutte" analyseaspektet) og se det fra forskjellige synsvinkler eller vinkler. Dette kan skje når alle dataene til uttakene mottas og legges inn i hypercube. Analytikeren kutter ut salgsdatasettet fra OLAP Cube. Det blir deretter sett på når du analyserer salget av individuelle enheter i hver region. På dette tidspunktet kan andre brukere fokusere på å evaluere kostnadseffektiviteten ved salg eller å evaluere effektiviteten til en markedsførings- og reklamekampanje.
vri (Pivot). Dataakslene roteres i den for å gi en erstatning for presentasjonen av informasjon.
Variasjoner av databaser
I prinsippet er dette en typisk OLAP-kube som implementerer analytisk behandling av flerdimensjonale data ved bruk av OLAP Cube eller en hvilken som helst datakube, slik at den analytiske prosessen kan legge til dimensjoner etter behov. All informasjon som lastes opp til en flerdimensjonal database, vil bli lagret eller arkivert og kan hentes opp når det er nødvendig.
OLAP Type | verdi |
Relasjonell OLAP (ROLAP) | ROLAP er en avansert DBMS sammen med flerdimensjonal datakartlegging for å utføre standard relasjonsoperasjoner |
Multidimensjonal OLAP (MOLAP) | MOLAP - implementerer arbeid i flerdimensjonale data |
Hybrid Online Analytical Processing (HOLAP) | I HOLAP-tilnærmingen lagres aggregerte totaler i en flerdimensjonal database, og detaljert informasjon lagres i en relasjonsdatabase. Dette sikrer både effektiviteten til ROLAP-modellen og ytelsen til MOLAP-modellen. |
OLAP Desktop (DOLAP) | I Desktop OLAP laster brukeren ned en del av dataene fra databasen lokalt eller til skrivebordet sitt og analyserer dem. DOLAP er relativt billigere å distribuere fordi den tilbyr svært liten funksjonalitet sammenlignet med andre OLAP-systemer |
Web OLAP (WOLAP) | Web OLAP er et OLAP-system som er tilgjengelig gjennom en nettleser. WOLAP er en tre-lags arkitektur. Den består av tre komponenter: klient, mellomvare og databaseserver |
Mobil OLAP | Mobil OLAP hjelper brukere med å motta og analysere OLAP-data ved hjelp av sine mobile enheter |
Romlig OLAP | SOLAP er opprettet for å lette håndteringen av både romlige og ikke-romlige data i et geografisk informasjonssystem (GIS) |
Mindre kjente OLAP-systemer eller -teknologier finnes, men dette er de viktigste som for tiden brukes av store selskaper, forretningsstrukturer og til og med myndighetene.
OLAP-verktøy
Verktøy for online analytisk prosessering er veldig bra presentert på Internett i form av både betalte og gratis versjoner.
De mest populære av dem:
- Dundas BI fra Dundas Data Visualization er en nettleserbasert plattform for forretningsintelligens og datavisualisering, som inkluderer integrerte dashboards, OLAP-rapporteringsverktøy og dataanalyse.
- Yellowfin er en plattform for forretningsintelligens, som er en enkelt integrert løsning designet for selskaper i forskjellige bransjer og størrelser. Dette systemet er konfigurert for bedrifter innen regnskap, reklame, landbruk.
- ClicData er en BI (Business Intelligence) løsning som hovedsakelig er designet for bruk av små og mellomstore bedrifter. Verktøyet lar sluttbrukere lage rapporter og dashboards. Board ble opprettet for å kombinere business intelligence, corporate performance management og er et fullt funksjonelt system som betjener mellomnivå og bedriftsbedrifter.
- Domo er en skybasert forretningsadministrasjonspakke som integreres med flere datakilder, inkludert regneark, databaser, sosiale nettverk og all eksisterende sky- eller lokal programvareløsning.
- InetSoft Style Intelligence er en programvareplattform for forretningsintelligens som lar brukere lage dashboards, visuell OLAP-analyseteknologi og rapporter ved hjelp av mashup-mekanismen.
- Birst fra Infor Company er en nettverksløsning for bedriftsanalytikere og analyser, som kombinerer ideene fra ulike team og hjelper deg med å ta informerte beslutninger. Verktøyet lar desentraliserte brukere øke modellen for bedriftslag.
- Halo er et omfattende system for styring av forsyningskjeder og business intelligence som hjelper i forretningsplanlegging og varebeholdning for forsyningskjedestyring. Systemet bruker data fra alle kilder - store, små og mellomliggende.
- Chartio er en skybasert business intelligence-løsning som gir grunnleggere, forretningsgrupper, dataanalytikere og produktgrupper organisasjonsverktøy for hverdagen.
- Exago BI er en nettbasert løsning designet for implementering i webapplikasjoner. Implementeringen av Exago BI gjør det mulig for selskaper i alle størrelser å gi kundene spesiell, betimelig og interaktiv rapportering.
Virkning av virksomheten
Brukeren vil finne OLAP i de fleste forretningsapplikasjoner på tvers av bransjer.Analysen brukes ikke bare av næringslivet, men også av andre interesserte.
Noen av de vanligste applikasjonene inkluderer:
- Markedsføring av OLAP-dataanalyse.
- Regnskap som dekker salg og utgifter, budsjettering og økonomisk planlegging.
- Styring av forretningsprosesser.
- Salgsanalyse.
- Databasemarkedsføring.
Industriene fortsetter å vokse, noe som betyr at brukere snart vil se flere OLAP-applikasjoner. Flerdimensjonal skreddersydd prosessering gir mer dynamisk analyse. Det er av denne grunn at disse OLAP-systemene og teknologiene brukes til å evaluere hva-hvis-scenarier og alternative forretningsscenarier.