Att avslöja differentiering: en ny era med skalbar infrastruktur kommer

Hämtmat: Värd Rebecca Jozwiak diskuterar framsteg inom databasarkitektur och lagring med Dez Blanchfield, Robin Bloor och Brian Bulkowski.

Du är för närvarande inte inloggad. Logga in eller registrera dig för att se videon.

Rebecca Jozwiak: Mina damer och herrar, hej och välkommen till Hot Technologies 2016. Idag är vi, "Exposure Differentiation: A New Era of Scalable Infrastructure Arrivates." Jag går in för Eric Kavanagh idag. Jag är Rebecca Jozwiak, din ödmjuk värd från styrelsegruppen medan Eric är borta på Jamaica. Bra för honom.

Så som det har varit i årtionden, är det här året varmt, även om tekniken troligen går i en takt som överträffar Moores-lagen, och vad gör organisationer för att hålla jämna steg? De letar efter vad som är snabbt, och skala, skulle jag hävda, är förmodligen en av de viktigaste sakerna när vi tänker på databaser. Och naturligtvis har vi alternativen för den vanliga relationen, nu har vi vår NoSQL, vi har vår kolumnlagring, vi har våra grafidatabaser, våra RDF-databaser, men verkligen, vad företag letar efter är skala, är parallellitet och är snabb .

Nu var traditionella arkitekturer baserade på den relationella modellen. Men om du tittar på de flesta webbverksamheter som har dykt upp under de senaste tre, fem, tio åren är det inte modellerna de använder för sin infrastruktur. De använder en annan, en parallellarkitektur, de skalar och de är snabba, och det är det som många människor vänder sig till i dag.

Vår sortiment, vi har Dez Blanchfield, han är en forskare från Bloor Group. Vi har doktor Robin Bloor, vår chefanalytiker på Bloor Group, och vi har Brian Bulkowski, CTO och grundare på Aerospike. Så killar med det, jag kommer att överföra det till Dez.

Dez Blanchfield: Tack, och tack för att du har mig här. Jag kommer att försöka skapa scenen för hur vi mycket snabbt kom dit vi är, och vi kommer att dyka in i mycket mer av den tekniska detaljerna när vi går igenom dagens ämnen. Jag kommer bara att få kontroll över skärmen här.

Så större, bättre och snabbare. När jag tänker på var vi befinner oss, bilden som hela tiden kommer att tänka på mig personligen, är det just den bilden som jag har fått på min titelruta, som är universums expansion. Vi har fått teknik att utvecklas och växa i decennier nu, faktiskt från slutet av femtiotalet när stordatorn blev en riktig sak. Tekniken har fortsatt att växa i många fall på en sämre eller större än en linjär kurva, beroende på vilken del av kurvan du är på, såvida mjukvaran eller hårdvaran går.

Skalan har blivit större och större och snabbare och snabbare, så långt det vi försöker leverera, och mindre och mindre på tillverknings- och halvledarnivå. Och i mitten finns det programvara och applikationerna och systemen som ligger till grund för den programvaran, och de tenderar att bli mindre och mindre till sin natur, och vi har sett saker som containeriserade applikationer och mikroservrar, det har blivit en sak igen. Vi gjorde det tidigare, decennier innan, men som ett resultat av att vi blir mindre och mindre där, blir vi större och större i den omfattning som vi nu kan köra saker, till exempel applikationer och särskilda databaser, och logiken för dessa databaser.

Jag har den här uppfattningen där vi har skalat mycket horisontellt, i huvudsak X-axeln. vi har skalat vertikalt i Y-axeln. Vi är vid den punkt där vi måste gå någon annanstans, och i mitt sinne är det som mentalt föreställt som en Z-axel, och det är att vi måste gå djupt in i tekniken och titta på hur vi kan göra saker annorlunda än vad vi har gjort hittills, för att få den extra hastigheten. Så jag visualiserar hela universums expansion, där vi har haft en explosion och vissa teknologier finns, och detta bättre linjär tillväxt och efterfrågan. Vi har varit tvungna att hitta olika sätt att få det större, bättre och snabbare resultatet.

Bara för att snabbt täcka typ där vi befinner oss nu i ett par hårdvarumiljöer. Vi har sett de fallande kostnaderna för en gigabyte hårddiskutrymme åstadkomma ett par ganska stora övergångar och teknik och tillvägagångssätt för den större, bättre och snabbare skalan. Dessa är två separata grafer som täcker ungefär ett decennium, drygt ett decennium var och en av det fallande priset på en gigabyte hårddiskutrymme.

Det är en klassisk J-kurva eller en hockeyklubba som vi ofta hänvisar till dem, för att du för en tid sedan kunde spendera bokstavligen hundratusentals dollar för att köpa en gigabyte diskutrymme, inte för två decennier sedan, medan det idag har blivit dollar och så småningom är jag säker på att det kommer att hamna, vad vi säger loppet till noll, det kommer att bli cent. Det medförde en intressant förändring i typen av saker som företag kunde göra. Och jag hänvisar till det som en störning genom data eller big data i synnerhet, och med det, vad jag menar är att vi såg teknologier, som hur man blir en sak där vi kunde skala mycket horisontellt i lagring, och vilken typ av beräkningar vi kan tillämpas på den lagringen, och hur det öppnar en intressant teknik eftersom det gör att vi kan göra mycket stora, redundanta parallella lagring på den snabbaste nivån, och Hadoop delar i sig självt, naturligtvis att vi kan kopiera data i en skrivning en gång läst många gånger format och bara skala ut saken i en nästan linjär klass.

Och det är alla företag som det här som verkligen kommer till störningar med big data. Vi har företag som Uber som är världens största taxibolag. De äger egentligen inga taxibilar, och det är en lång lista här. Airbnb är den största leverantören av boende, har faktiskt inga fastigheter. En av mina favoriter är till exempel i den här listan, där de faktiskt inte skapar innehållet, vi skapar det för dem, men de är faktiskt den största medieägaren på planeten. Vi har intressanta som de snabbast växande bankerna, har faktiskt inga pengar. Det här är peer-to-peer-utlåningsplattformar och banker, och det finns en i Australien särskilt som växer berömmelse här som kallas SocietyOne. Och några av de stora bankerna som måste ha kontanter investerar i den särskilda peer-to-peer-banken. Och vi går igenom den här listan till Netflix; de äger egentligen inte några biografer och ändå är de effektivt det största biohuset på planeten.

Så de kom dit de var, i min mening, genom tillämpning av smarta teknologier på datanivå, eftersom vi kunde göra större och bredare lagring till lägre kostnader på grund av det sjunkna priset på en gigabyte hårddiskutrymme, och vi kunde tillämpa lite intelligent dator och distribuera en datormodell över det. Dessa företag hade förmågan att skapa en konkurrensfördel och störa som en följd av de fallande kostnaderna för diskutrymme.

Vi har sett en liknande sak hända i minneskostnaderna. För ett par decennier sedan, om du hade sex miljoner dollar liggande, kan du köpa en gigabyte RAM, och vi har haft en mycket lik J-kurva eller hockeyklubba, äga rum för att minska kostnaderna eller det fallna priset på BAGGE. Och det har medfört några intressanta saker, och i min mening är en av de största störningarna i det utrymmet mängden minne som kan byggas in i enheter, som mobila enheter, som telefoner och surfplattor och till och med bärbara datorer. Datorer i dag, hur mycket minne som går till en genomsnittlig bärbar dator är det i vissa fall ganska löjligt. I vissa fall har min nuvarande bärbara dator mer minne än vissa servrar som de använde för inte så länge sedan.

Detta har medfört betydande förändringar i sig självt, på ett liknande sätt som ett RAM-minne har för mig, det tillät oss att skala och skala snabbt. Och nu har vi fått fram en teknik som vi kallar flash, och det här är en teknik som ursprungligen härstammar från något som satt på hårdvara i form av en EEPROM, ett litet chip som är utformat för att kunna vara tillgängligt, och skriva till, och sedan bara när strömmen släpptes skulle det hålla vad du skrev till det chipet som en bestående lagring. Det var långsamt, det var klumpigt och i dessa dagar tror jag att det handlade om 1980–1981 blev det slags. År 1984 gjorde Toshiba, som jag tror uppfann tekniken, den till en kommersiell sak som vi kunde använda.

Men innan länge tänkte folk ut att de faktiskt skulle kunna ta en kombination av komponenterna som användes för att skapa detta koncept av en EEPROM, ett skrivskyddat minne, när det raderats och skrivits till det, och de faktiskt kunde skriva till det regelbundet och använda det lite mer som diskutrymme och lite mer som RAM. Med tiden utvecklades det. Nu har denna flash-lagringsteknik varit en sammanslagning mellan traditionell disklagring, vare sig det är en snurrdisk eller i vissa fall en hybridskiva med minne och RAM. Och det viktigaste är systemet mellan eftersom du kan läsa och skriva till det och sedan stänga av strömmen, och det kommer att behålla det du har skrivit till det. Så ett diskutrymme, uppenbarligen skriver du till det, du stänger av strömmen, och den snurrande spindeln och det kraftigt modifierade, för att ha en bättre beskrivning, behåller nollorna och de du har skrivit till den.

I minnesutrymmet för slumpmässig åtkomst skriver du något till minnet i RAM, du stänger av datorn och allt torkas eftersom det inte finns fler elektroner för att hålla det laddat och hålla informationen du skrev till den. Dessutom är det i mitten och det är extremt snabbt, snabbare än disk, lite långsammare än RAM. Men du kan skriva till den och läsa från den, och när du stänger av strömmen kommer den att fortsätta. Detta har medfört några fantastiska tekniker och särskilt har vi utvecklat mobila enheter och bärbara datorer som är riktigt, riktigt snabba och kan göra många saker, och nu flyttas det in i infrastrukturutrymmet kring lagring och dator, och det har medfört betydande förändringar i vad vi kan leverera i skala. Det här är en typ av plats där jag tror att Z-axeln i mitt sinne kommer nu.

Det är nästan bara i tid på många sätt, eftersom vi nu har sett en störning genom vad jag kallar efterfrågan, och det är att konsumenterna har, oavsett vad som händer i infrastrukturen och teknologirummet, och förmågan att köra snabbare och snabbare beräkningar och prestanda på infrastrukturnivå kräver konsumenterna denna störning i form av det som det hänvisas till nu, kändisupplevelsen. Alla vill att alla system, varje app, varje webbplats ska veta vem de är och vad de gillar och att kunna ge dem en personlig en-till-en-upplevelse. Det är inte tillräckligt bra längre bara att gå till en webbplats där jag köper biobiljetter. Jag vill att den ska veta vad jag har köpt tidigare, varför jag köpte det och eventuellt vad folk precis som jag köpte och rekommenderar saker.

Ofta ser vi vad jag hänvisar till är en sidoordning av sociala, och det är att jag vill ha kändisupplevelsen, men jag vill också socialisera den idén, jag vill dela den med alla mina vänner och berätta för dem vad jag gör, och jag vill också veta vad mina vänner gör. Och detta är ett resultat av en explosiv efterfrågan på ytterligare beräkningar och lagring, och snabba vändningar av saker. Vi har sett Fitbit-generationen, det jag kallar alltid-på-spårning. Allt jag gör spåras, loggas och fångas någonstans. Vi har sett allting i realtid: bank, budgivning, rekommendationsmotorer, att kunna hantera saker i realtid som jag personligen gör som konsument.

Och då ser vi en mycket stor inverkan, som säkerhetsriskerna kring cybersäkerhet. Det brukade vara så att vi hade enskilda hackare, sedan hade vi kriminella gäng som applicerar sig själva på det, nu har vi hela nationer som går i krig över internet, vilket är en riktig sak och faktiskt händer. Var uppmärksam på det, sitta upp och titta på det, för det har en verklig inverkan på det, och några av våra pre-show-banter handlade om att diskutera risken för att din egen dator, eller åtminstone ditt nätverk, trängde in.

Vi har sett detta begrepp om utvinning av enheter. Utvinning av enheter är när vi måste hitta saker av intresse i mycket stora datauppsättningar och särskilt kring bedrägeri, olaglig aktivitet och hacker-typaktivitet. Men oftare ser vi att utvinning av enheter blir en fokuspunkt för bra saker och saker som är av värde för oss, i motsats till att leta efter saker som attackerar oss.

Vi har också sett en explosion, det som kallas geospatial data. Detta är data som faktiskt vet var de har sitt ursprung eller var andra data som de kommer från. Du kan föreställa dig att du står på gatan och vill hitta den närmaste parkeringsstationen, eller den närmaste restaurangen, applikationer som kan tillämpa geospatial computing och data, datoranvändning till data, som vet var det är i rymden, är mycket viktigt eftersom du måste kunna veta var andra objekt och enheter är och göra det snabbt.

Vi har sett permanent ansluten mobil. Även när vi sover på kvällen, kryssar våra mobiler fortfarande bort, uppdaterar våra, kontrollerar våra kalendrar, tittar på vad vädret är och tar reda på huruvida vad vi vill ha till frukost kommer att finnas tillgängligt. Det händer mycket buller där, och det har skapat en enorm inverkan på vad vi behöver göra i baksidan och hur snabbt vi gör det.

Sammantaget är den stora skalan och påverkan av vad som kallas tingen Internet, eller oftare än anslutning, maskin-till-maskin, där enheter pratar med enheter och som går hela vägen upp till motorer som är fastkopplade till sida av flygplan som säger själva flygplanet, eller flygplanshanteringssystemet, att ett lager på motor nummer fyra upplever alltför mycket slitage och värme, och bör bytas ut när vi landar, och sedan kommunicerar det till en annan maskin, och så borde den placera en ordning, och magiskt visas en ingenjör på flygning på flygplatsen och är beredd att byta ut den under tankningen.

Och skalan som är så stor och så stor att vi har tvingat gå in på vad jag hänvisar till det via tillgång till vilken typ av hantera det. Eftersom en ny värld, och välkommen till den nya världen, en ny värld av allt som vi använder för att vara anslutna; en gång i tiden var det satelliter och nätverksenheter, nu är det mobila enheter och våra bärbara datorer och surfplattor och telefoner, och till och med min helt nya Audi har en skylt inbyggd i den, och den rapporterar ständigt om sin egen hälsa, men uppdaterar också sig själv, och vet var det är, och vilka kartor som är tillämpliga, och säger till och med när jag ska gå en annan rutt om det finns trafik på vägen framåt.

Allt vi bygger nu, allt vi pratar med dig nu, designas för att ansluta och ansluta till andra saker, inte bara från mig till system utan från system till system och för att kunna hantera det vi jag måste tillämpa mycket olika tänkande i infrastrukturlagret, både på hårdvaran och programvaran, och i synnerhet databaslagren som system behöver för att underbygga detta, och på många sätt har databasen blivit motorn, och apparna är verkligen bara små bots som gör saker.

Jag kommer att sluta snabbt här med den här lite humoristiska uppfattningen om var vi ska med dessa saker, och vad jag kallar "IoT med en knapptryckning." Det har skapats en ny gadget som kallas " Amazon Dash-knapp, och det här är en liten tumme-storlek. Faktum är att det på många sätt är detsamma som min USB-tumenhet. När du köper den här saken handlar det om $ 4,99 amerikanska online från Amazon, den skickas till dig, du konfigurerar den med din mobiltelefon och du bokstavligen ansluter den till en av dina enheter, till exempel ett kylskåp eller en tvättmaskin eller vad som helst. I ditt tvättmaskineksempel, om du så småningom blir slut med tvättpulver, kan du trycka på den knappen och den kommer att ringa hem och automatiskt beställa mer åt dig, och magiskt kommer fler att skickas till dig via våra goda vänner på Amazon.

För mig skrämmer det mig, eftersom det kommer att se en explosion av ett antal saker som är anslutna i nätverket och försöker skapa anslutning och skapa efterfrågan. Om du kan föreställa dig, är en eller två av dessa saker kanske inte så skrämmande, men förra gången jag tittade, det var över 110 av dessa saker märkesvaror, så nästan alla märken på planeten kommer att försöka få sin egen lilla push- knapp IoT, att du går hem och trycker på en knapp och det säger: "Beställ en pizza." Du trycker på en annan knapp och den beställer en förbyggd lunch för dina barn till skolan imorgon.

Det driver en så enorm efterfrågan på omvandling i baksidan, på applikationsnivå, särskilt på databasnivå, att jag tror att vi bara har sett toppen av isberget av den typ av prestandetransformation vi behöver se . Och med det kommer jag att överlämna det till doktor Robin Bloor och få hans insikter i typ där vi är, också.

Rebecca Jozwiak: Okej Robin, jag har passerat bollen.

Robin Bloor: Är det inte bra? Okej, här går vi, det är jag. Jag såg Dezs presentation innan jag kom till den här, så jag skulle säga saker som är gratis istället för att bara upprepa några av de saker som Dez sa. Jag trodde att jag skulle prata om databasutveckling i termer av vad som faktiskt har hänt med arkitekturen, och så vidare, av databaser ur ett historiskt perspektiv.

Det grundläggande problemet som varje databasleverantör har är att upprätthålla en flexibel arkitektur som skalar och håller i takt med hårdvaruutvecklingen. Jag ska prata tänkte detta, men när du faktiskt tittar tillbaka och ser hur databaserna brukade byggas och hur de byggs nu, är de faktiskt väsentligt annorlunda än vad jag skulle kalla den arkitektoniska designnivån . Det är värt att bara granska varför det är, eller åtminstone tror jag det är. Hårdvarufaktorerna och Dez har gett oss en särskilt bra översikt av de nedre lagren när det gäller minne och disk. Vad vi har nu, och det här är framtiden, Intel är nästa, CP som kommer att ha en FPGA på det. Vad folk kommer att göra med det, jag har inte en ledtråd. AMD slår samman CPU och GPU och vilken skillnad kommer det att göra? Det här är de typer av förändringar som faktiskt kommer att göra skillnad i databasen, och jag misstänker att Aerospike bland andra, eftersom Aerospike drivs av prestanda, det är förmodligen redan att titta på det och ta reda på vart det tror att det faktiskt kommer att gå med hur produkten fungerar.

Vi har ett system på ett chip som ännu inte har startat. SSD: er som vi känner till, men poängen att göra är att de faktiskt ökar i hastighet, ungefär Moores lagstakt, en faktor på 10 vart sjätte år. Men Intel håller på att släppa 3D-tvärpunkt, som påstår sig kunna gå mer än hundra gånger snabbare än SSD: er, i själva verket slags droppar i mixen, då kommer det att förändra hastigheten som produkter som Aerospike faktiskt kan gå.

Sedan har vi de parallella hårdvaruarkitekturerna, med andra ord det sätt som vi har konstruerat hårdvara i den meningen: ursprungligen var det bara en CPU som satt över minnet, som satt över hårddisken, men det har blivit väldigt mer komplicerat än så. Idén med ett system på ett chip är att du faktiskt kan ha parallellism-chip till chip till chip och få allt till hög hastighet, och vi har ingen aning om exakt vilka av dessa produkter som faktiskt kommer att dominera.

Det är bara en titt på framtiden, men på hårdvarunivån accelererar prestandan och kostnaderna fortsätter att sjunka, typ av linjer som Dez beskrev. Dina processorer blir inte nödvändigtvis billigare, de blir bara snabbare och så vidare.

Från affärsperspektivet, i vissa situationer, och det är marknadssituationer, var det första är där affärsvärdet är. Om du särskilt - om du är helt övertygad om att en viss aktie kommer att falla i pris, får den första personen som får försäljningsorder i bästa pris. Det är verkligen så enkelt. Därför finns det en teknikkapp som går vidare till automatiserad handel i bankerna för att faktiskt försöka vinna dessa situationer. Vad hände efter det? Vad händer efter att bankerna har gjort sin sak med allt detta? Du börjar plötsligt se att andra områden smittas av samma behov av snabbhet.

Det som hände verkligen är att människorna togs bort från ekvationen, och det hände med internetreklam mycket snabbt. Men saken var att det inte är den specifika transaktionen, genomförandet av metoder, det här är en hel affärsprocess, det är det faktum att en webbsida just har kastats av, och ett beslut måste fattas som kan vara ett ganska komplicerat beslut, när det gäller vilken annons som faktiskt ska läggas ut på den här webbsidan, och drar av vem som användaren av webbläsaren är vad som skulle vara den mest lämpliga annonsen att sätta på den, och så vidare. Det har blivit en mycket komplex sak, och jag kommer att nämna det igen.

Men poängen är att prestandan och skalbarheten i affärsprocessen inte är samma problem som prestanda och skalbarhet för en fråga kapacitet, och det är något som jag är väl medveten om, på grund av ett nyligen informationsrum vi gjorde med Aerospike som de är jag också medveten om. En annan sak, när du faktiskt arbetar med dessa hastigheter, är tillgångsegenskaper viktiga för en transaktion, varje händelsehantering. De spelar verkligen roll. Så mycket fruktansvärt av vad vissa databaser gör, som förlorar ett brev eller två från tillgången, kan fungera rimligt bra i nackdelarna - det kommer att fungera bra i de koner vi pratar om. Det är inte riktigt acceptabelt att vara ärlig.

Ur teknikperspektiv tittar man faktiskt på - jag vet att det finns två slags hävstångseffekter för att skapa den typ av arkitekturer som faktiskt krävs för att ge den typ av hastigheter som kan göra, som Aerospike, kan göra en miljon transaktioner per sekund. Du måste faktiskt vara mycket exakt när det gäller programvaruutvecklingen. Du kan inte bara hacka bort. Du måste vara bekymrad över kodvägslängder. Du måste använda utmärkt i minnet och du optimerar faktiskt hela transaktioner. Du behöver intelligent parallellism och du behöver också misslyckasäker parallellitet. Du måste skala upp, snarare än att skala ut, för så snart du involverar nätverket i någonting blir det den mest troliga pekaren som du kommer att drabbas av latens och det kommer att börja göra transaktionerna för långsamma.

Du måste få så mycket som möjligt till en given känd av ett nätverk innan du faktiskt skalar ut, och du verkligen inte vill skala ut snabbt, du vill verkligen inte ha många processer. Du vill ha ett nätverk som inte används av någon annan. Och du vill ha ett otroligt snabbt nätverk.

Accelererad SSD-lagring är något - jag tror faktiskt att det mesta gäller för Aerospike. En av de intressanta sakerna är att det är en NoSQL-databas. Det brukade tros - jag vet inte, för ett antal år sedan - det brukade tros att den relationella databasen var den enda databasen och den dominerade allt, och det var bara dessa udda små nisch-situationer där du inte behövde gå relations. Det är liksom vänt på huvudet nu. Det är de snabba databaserna som finns på de SQL-databaserna, och en av orsakerna till det, det främsta skälet till det, är att de undviker att gå med i data, de lagrar data ganska mycket på ett objekt. När du är klar med ett objekt lagrar du bara det och sedan drar du hela objektet tillbaka, det går inte ihop saker för att faktiskt bearbeta dem. Detta är vad hastigheten handlar om. Dessa typer av tekniker som genererar hastighet i databas con.

Detta är spåren av tårar, det här är vad som hände med databasen. Historien eller berättelsen om de relationella databaserna var slutet på en databas var faktiskt inte sant. Även när de började dominera var det fortfarande nödvändigt. Objektdatabaser gjorde de tidigare transaktionerna på dessa dagar, eftersom relationsdatabaser faktiskt inte kunde göra dem, och sedan visade det sig att de relationsdatabaser som använder radbutiker, de kunde inte heller göra snabba frågor, du behövde kolumnlagrar. Och sedan upptäckte vi att om du faktiskt ville göra grafiska frågor om data, varken en kolumnlagring eller en relationsdatabas skulle vara något bra, och du faktiskt behövde bygga en specifikt grafmedveten databas för dig. Sedan kom RDF-databaser in, och så snart du faktiskt började överväga innebörden av semantik och vi fick NoSQL-databaserna i, väldigt mycket specifikt för hastighet. Att kalla dem NoSQL är nästan som om du märker alla dessa databaser som om de var desamma, de är faktiskt radikalt annorlunda vad som ligger under. Det enda skälet till att de bär namnet NoSQL är att de inte ger något fan om SQL eftersom det är för dyrt. Transaktionsfördröjningar som de behöver.

IoT - som jag trodde att jag skulle avsluta på samma punkt som Dez avslutade den på - den är inte över, all denna situation i fråga om hastighet och fördröjningskrav, det går inte förrän den feta damen börjar avstå från detta data, och det har inte riktigt börjat ännu. Mycket av den informationen kommer att vilja ha de latenser som jag har visat på, så jag tror att det är allt jag har att säga. Låt oss överlämna det till Aerospike och Brian Bulkowski.

Brian Bulkowski: Hej, mycket tack för att jag gick med i Bloor Group och jag själv för denna presentation idag. När jag tänkte på vad Dez och Robin bara pratade om, skulle jag vilja berätta lite om banan Aerospike har tagit när det gäller att tillhandahålla ny databasteknik och NoSQL-databasteknologi till ett antal branscher. Det har varit en bra väg. Vi startade Aerospike 2008 med att se en hel del av trenderna som Dez och Robin har nämnt. Specifikt om databaser i minnet att kunna dra nytta av blixt, liksom typen av utskalade molnsystem, och vilken typ av skala som krävs för att göra personalisering, beteendeanalys och vilken typ av VIP-upplevelser som är diskuterade.

När vi närmade oss problemet med en databas som var en front-end operativ databas som kunde ge underlag till applikationer som kunde skrivas för att lösa dessa, började vi med problemet hur vi i princip kunde bygga en distribuerad hashtabell, minne -fördelade hashtabellen som var förvånansvärt snabb och kapabel till saker som miljoner transaktioner per sekund, men till ett rimligt pris. När vi avslutade vår prototyp insåg vi att vi då skulle behöva ta reda på vem som kan behöva den här typen av hastighet. Som ett Silicon Valley-företag upptäckte vi snabbt att det verkligen var reklambranschen som kunde konsumera den här typen av information och var intresserad av den, och därför skulle jag vilja spendera en sekund på att prata om realtidsbudgivning och hur detta marknaden fungerar.

Robin nämnde hur finansiell handel fungerar, vilket är den första transaktionen ofta är den vinnande transaktionen, och det finns i huvudsak en tid till marknad för latens och ett värde för latens. Reklambranschen är något annorlunda, på ett intressant sätt, eftersom målet med reklam är en speciell - det som kallas intryck, förmågan att leverera en annons - är en auktion och auktionen går mellan tio millisekunder till femtio millisekunder. Spelets namn, och det finns ofta hundratals företag som nu bjuder i realtid på varje enskild annons som är placerad på internet, är att få så mycket data som möjligt och ta med de bästa algoritmerna inom tio till femtio millisekunder över största mängden data.

Denna förändring och förändring skedde i reklambranschen, i vart och ett av dessa små millisekunder, har en tidsbegränsad komplikation med de bästa algoritmerna över den största mängden data, och för att göra det samlar du massor av små bitar med data. Senaste IP-adressinformation, ny information om en viss enhetskategori, ny information om webbplatsbeteende, senaste söktermer, allt skulle gå in i den hemliga såsen hos ett visst företags algoritmer för att bestämma ett pris och ett bud.

Detta har varit en fascinerande marknad att vara en del av. Vi gjorde först vår första distribution på Aerospike 2010 med några av de första företagen som arbetat på allvar inom realtidsbudgivningsekonomin, och sedan har vi uppnått, i princip att vara den främsta butiken av beteendedata, för majoriteten av företagen i det rymden. Det vi har hittat sedan dess och är en speciell arkitektur som jag kommer att beskriva genom denna presentation är att allt hände 2010, 2011, 2013 och fortsätter att utvecklas. Reklam är en mycket dynamisk marknad.

Men den typen av VIP-upplevelse, kan du tänka på att placera rätt annons, placera inte en annons för säga barns produkter, eftersom jag inte råkar ha några barn, så jag kommer inte att ha en effektiv annons om den är placerad på det, men om det handlar om snabba bilar är det den typen av annons att placera till Brian. Det är verkligen den typen av VIP-upplevelse i erbjudanden, i fråga om att rabattera eller inte, om du är på en detaljhandelssida, även när det gäller bedrägeri. Är detta det normala mönstret för en viss person eller ett visst kreditkort? All den formen av teknik för realtidsanalys, av beteendeförutsägelse, av prediktiv analys, sipprar nu ut ur reklambranschen, som har gjort det för skojs skull och vinst nu i ganska många år, och verkligen kommer in i detaljhandeln och bank- och bedrägerietektering, etc., genom en viss arkitektur. Så Aerospike har varit privilegierat att vara en del av ett antal av dessa fall.

Arkitekturen som vi ser fungerar och är praktisk för att göra detta, är en där i stället för att skapa en uppsättning frågor från en applikationsserver, istället flytta mer av din beräkning till själva appservern och sedan använda en databas som i huvudsak en lagring motor för den typ av objekt som Robin pratade om. I det här fallet förväxlar inte dessa arkitekturer först och främst detta med din faktiska analys här. Du ser till höger om denna bild att det fortfarande finns en analys här för att generera insikter. Det här är jobb som ofta arbetar över petabytes, tiotals petabyte med data, till och med exabyte i fallet med några av våra stora kunder med olika tekniker. Du måste ha ett big data-team, ett analysteam, ett kvantitativt team där ute för att hitta vad, säg, geospatiala koordinater spelar roll, vilka modeller som fungerar för att hitta dessa relationer och skapa VIP-upplevelsen. Det är ett helt problem för sig själv och inte ett som Aerospike direkt har deltagit i, och det finns en massa bra teknik när du har att göra med den typen av system.

Vad vi har varit glada över och arbetat med branschen om är, när du väl har fått den insikten, hur du engagerar dig i den typ av maskin-till-maskin eller snabb maskin-till-människa transaktion, där du tar dessa insikter och gör de verkliga för varje person, ögonblick för ögonblick? Arkitekturen som vi har sett använder det är en där det finns en applikationsserver som är skriven och som gör allt det matematik och tittar igenom modellerna som du har skapat, och tittar på det senaste beteendet och gör det över huvudsakligen ett viktigt paradigm eller åtminstone mycket fråga-lätt typ av system.

När du har att göra med de typer av datatyper som vi pratar om, den typ av flöden som vi pratar om, med miljoner skrivningar per sekund, miljoner läsningar per sekund, miljoner och hundratusentals beslut per sekund för det andra, att bygga komplexa index, multidimensionella index, fungerar helt enkelt inte särskilt bra, det är inte skalbart. Sättet att uppnå denna form av skala är att engagera en hel del parallellism. Vi pratar lite om hur vi gör det senare. Men en del av det är en statslös appserver skriven på ditt eget språk.

Det vi ofta ser är ett visst projekt som antar en ny applikationsram baserad på de människor som arbetar där, tekniken som de använder och problemet de närmar sig. Vi har sett människor som använder Python, många använder Java, vi ser fortfarande C-programmerare, för mycket av detta är fortfarande högpresterande, kanske till och med med saker som de gamla MATLAB-biblioteken. Och de måste beröra tusentals tusentals datapunkter per sekund för att fatta ett effektivt beslut.

En fråga som jag har ställt ibland är: "Tja, Brian, om du kan miljontals transaktioner per sekund, vem behöver det?" Om du till exempel tittar på nordamerikansk betalningsbehandling och Aerospike är involverad i lösningar som gör upptäckt av bedrägerier inom det systemet, och som stöder applikationsförfattare som gör några mycket innovativa saker i upptäckten av bedrägeri, det finns bara några tusen betalningstransaktioner per sekund som flödar genom även den största betalningsprocessorn. Och ändå, när det första företaget kom till oss och sa att de tittade på att använda NoSQL, och ville se hur vår lösning skulle se ut som underlag för deras ansökan, sa de att de ville beröra 5 000 data i ett 750 millisekunders fönster. Nåväl, nu har du plötsligt några hundra affärstransaktioner och några tusen data att tänka på i varje beräkning, och nu är du uppe i området med att behöva miljontals transaktioner per sekund.

Fallet med - att lägga undan reklam för en sekund, är fallet med bedrägeri fascinerande eftersom var det finns pengar, det finns bedrägeri och realtidsförhindrande av bedrägeri, i motsats till att försöka sortera igenom analytiskt efter att ett bedrägeri har hänt, är verkligen en fråga om att få online så mycket data som möjligt, och du kan tänka på det som en återspegling av den VIP-upplevelsen. Uppträder den personen på ett sätt som de vanligtvis inte uppför sig? Och därmed ökar chansen att det är ett bedrägligt system, och inte faktiskt den här personen. Har den här personen vanligtvis åtkomst via en viss enhet eller uppsättning enheter, med en viss uppsättning skärmupplösningar? Visar de vanligtvis ett visst beteendemässigt shoppingmönster? Kanske kan vi nappa bedrägerier i knoppen under själva transaktionen. Det borde påminna dig mycket om vilken typ av saker som händer inom en transaktion i annonseringssystemet.

De typer av system vi löser är sådana där varje enskild betalningsprocessor har ett stort datateam, de har mycket historisk data, de skapar nya modeller, de delar inte med oss på Aerospike alla modeller, för de är verkligen en hemlig sås. Om du är en prenumerant på Gartner och du hörde Gartner prata om algoritmekonomin, är det en algoritm och ett företag som kämpar head to head för att få ner bedrägeri och för att få upp antalet framgångsrika transaktioner, eftersom du inte heller vill ha för att blockera transaktioner. Det är den typ av projekt som vi letar efter i Aerospike på dessa nivåer.

Ett annat fall som vi har arbetat med företag inom finansiella tjänster är det som kallas Intraday System of Record. I det här fallet, vad som händer är typen av rikare erfarenhet, även i ett detaljhandelssystem, där jag vill kunna titta på min speciella position och jag vill göra det extremt exakt. Jag vill inte ha en fångst framför mitt DB2-system. Istället vill jag titta på de exakta uppgifterna, och mellan mobil, men också saker som en omberäkning av risker, riskberäkningar bör nu göras minut för minut, du vill kunna beräkna alla risker samt den globala risken, systemrisk i hela företaget inom några minuter.

Och igen, det är samma problem. Varje enskilt konto som är ett särskilt, tänk på det som en nyckelvärdesuppsökning till ett visst objekt, då kan detta göras parallellt, och viktigast av allt, det här paradigmet låter dig skriva din kod och dina algoritmer på ett högnivåspråk, vilket är lättare att felsöka och snabbare tid att marknadsföra. I denna algoritmekonomi måste jag kunna få mina algoritmer online nu. Detta är ett mycket annat problem för modellering och affärsrelationer, vilket är vad relationella system är bra på. När du har en tabell över delar, och dessa delar är associerade med beställningar, och dessa beställningar är associerade med människor, har du en affärsprocess som kan modelleras strikt och förmodligen inte kommer att ändras under hela ditt livs livstid. En ny algoritm för att hitta nya bedrägerier måste emellertid skrivas korrekt och snabbt och få online, fatta affärsbeslut inom några dagar, åtminstone om inte snabbare. En NoSQL-lösning för denna typ av inspelningssystem är verkligen ett fantastiskt system för dessa killar, eftersom det gör att de kan lägga in data mycket snabbt, såväl som att bygga nya algoritmer, så inte bara en ny kundupplevelse när det gäller att adressera mobilen, men verkligen bygga ut en mängd nya applikationer.

Det vi ser på Aerospike på lång sikt är det faktum att varje databastyp, varje fysisk layout av data på disken har sina egna komponenter, och på Aerospike är vi verkligen fokuserade på detta nyckelvärde eller rollorienterade system, som Robin sa , med hög transaktionskonsistens och tillåter verkligen att människor gillar kolumnlagrar och högvolymdata sjöar och såväl hardcore transaktionssystem som har haft rapporteringsbegränsningar också. Vi ser att alla behöver matas in i en mängd olika sökmotorer. Vi ser några av de JSON-baserade sökmotorerna. Vi ser saker som elastisk sökning, vi ser Spark, alla behöver olika varianter vid olika tider av saker som kolumnbutiker, liksom radbutiker, som är där Aerospike utmärker sig.

Vi ser verkligen att dessa olika typer och industrin kommer till en punkt där att välja det bästa rasen för var och en av dessa kommer att bli en nödvändighet. Tyvärr, på grund av verkligheten i långsiktiga analyser och batchjobb vers versalys och operationella begränsningar, kommer vi förmodligen inte att få en enda, en storlek passar alla, men vi kommer att komma till punkten att kunna att välja klart mellan några av kärndatainformationerna.

Låt oss prata en minut om innovationen av blixt. Jag får fortfarande frågan, även om som tidigare har kommenterats, har flash varit med oss nu länge. När vi startade Aerospike 2009 var när jag tror 2009, kanske, ja, 2009 var när Intel kom ut med X25, som verkligen var den första massmarknads SATA bemannade flash-enheten, och det fanns ett antal blixtsystem innan det , men verkligen var det den som bröt in i en hel del teknikmedvetande. Fusion-io förde verkligen blixt till den bredare företagsmarknaden efter det.

Det som händer nu är tillkomsten av ett system som heter NVMe. NVMe är en standard som liknar SATA eller SAS eller till och med SCSI som gör att olika kortleverantörer kan samverka med drivrutiner i operativsystemet med hög effektivitet. Så det skapar en högre prestanda, för det första eftersom NVMe är baserad på PCIE som underliggande transport, vilket är mycket snabbare än SATA, SAS eller något annat, men också det tillåter förare av bästa ras.

Till exempel inom Linux finns den här killen Jens, och Jens är NVMe-drivrutin, Jens expo, och han gör ett bättre jobb än någon individuell tn som Intel eller Fusion-io kunde ha gjort med sin individuella drivrutin, med alla deras resurser. När du har kraften i själva operativsystemet att kunna bygga den bästa drivrutinen ser vi några riktigt fantastiska prestanda. Allt detta säkerhetskopierar idén att flash verkligen kan ge mycket av den låga latensen för RAM.

Nu är Aerospike fortfarande en stor RAM-databas på grund av sin klustermodell, men vi upptäcker att när du bara gör ett nätverkshopp, som du behöver ha skalbar lagring, spenderar du redan minst fem till 50 mikrosekunder, extra 70 mikrosekunder NAND är vanligtvis inte ett hinder, och du kan lika gärna använda blixt, med tanke på att NAND-blixt, med tanke på att nätverket redan är involverat i det. Många undrar sedan hur - allt detta låter bra om du köper din egen hårdvara, hur går det med de offentliga molnen? Jag tror att du hittar just nu, oavsett vilket offentligt moln du använder, de offentliga molnen har mycket starka flash-erbjudanden. Det skiljer sig lite från molnleverantör till molnleverantör. Amazon har sina I2-instanser som har varit ute för jag tror att ett år, två år nu, är verkligen ganska högkvalitativ blixtutformning, och Aerospike har implementeringsmönstret ovanpå dem.

Jag skulle vilja utropa Google Compute, Google Compute Engine, Google Cloud specifikt, för enligt vår erfarenhet har de hittills några av de högsta prestandaenheterna och några av de mest flexibla när det gäller distributionsmönster. Men också ser du nya distribueringsmönster som Pivotal, som är ett slags offentligt / privat, så att du kan göra rätt Pivotal-appar både platser som stöder blixt och stödjer olika lagringsenheter samt Docker-mönster. Så verkligen är detta en punkt i historien där flash inte bara är tillgängligt för dig att köpa och lägga in i dina datacenter, men verkligen har sjunkit genom alla infrastrukturleverantörer, eftersom det verkligen är det bästa sättet att få hög-IOPS-system på en mycket rimlig latens.

Bara ett ögonblick om Aerospike - Aerospike är en klusterdistribuerad databas, vilket gör den mycket mottaglig för installation i molnstil och datacentra. Vi finner att flexibiliteten i att kunna lägga till mer data och mer prestanda är absolut nödvändig i dessa typer av nya nya applikationer eftersom du startar ett projekt, du vet inte om du behöver femtiotusen transaktioner per sekund, hundra tusen, en miljon, två miljoner, så du vill ge dig själv lite utrymme för att kunna lägga till servrar. Och ändå vill du skala upp så att varje server kan vara snabb på egen hand. Du vill verkligen inte sluta med femhundra eller tusen servrar som är databasservrar som är långsamma. Skala ut är inte det enda spelet i stan, dess skala ut och skala upp, som Dez sa tidigare, det finns en ny Z-axel.

Förhoppningsvis ger det dig några nya idéer om hur snabbhet och skala hanterar nya marknader och kanske finns det projekt som du arbetar med där du kan överväga att bygga ut mer rika applikationer och använda en applikationsram med en mer nyckel värde eller NoSQL-databas under den. På Aerospike har jag verkligen sett många av våra kunder och många av våra open source-användare lyckas med det mönstret, och jag ser fram emot att branschen i högre grad ska anta det.

Rebecca Jozwiak: Tack så mycket Brian, och jag är säker på att Dez och Robin har några bra frågor till dig. Robin?

Dez Blanchfield: Jag är glad att hoppa in. Robin, har du en fråga? Annars har jag en snabb jag kan börja.

Robin Bloor: Tyvärr, jag var på stum. Jag dök in, men ingen hörde mig. Frågan reste mig omedelbart, eftersom det här är en mycket sofistikerad uppsättning teknikfunktioner. Vad gäller de befintliga kunderna som du har, vad är den typ av upptrappning eller transaktionsgrad som du upplever när det gäller några av dessa annonsapplikationer? Fortsätter transaktionsräntan att stiga? Och i så fall, i vilken takt?

Brian Bulkowski: Intressant fråga, Robin. Varje bransch har sin egen kurva i varje företag. Låt oss ta nordamerikansk reklam, till exempel 2012, visade nordamerikansk reklam förmodligen närmare 200 000 annonser per sekund, i form av standard intradag, inte min tid, och det har nu troligen eskalerat till cirka tre till fem miljoner annonser per sekund. Men då hände en intressant sak. Annonsbranschen började ta itu med vissa oro för bedrägeri, och de delar av branschen som kan blockera bedrägeri såg transaktionsräntorna falla lite, ungefär en faktor två, inom några av våra mer sofistikerade kunder som kunde fastställa bedrägeri. Naturligtvis var de tvungna att göra några databasuppslag för att blockera bedrägerier, så det hamnar på samma sätt i slutändan.

Ett intressant användningsfall är inom telekom, jag nämnde inte riktigt det, telekom såg transaktioner öka på grund av fakturering baserat på varje paket som passerar över mobiltelefonnätverket. I gamla dagar hade vi ringa detaljerade poster och en gång i minuten, ett samtal, vad du vet, en liten ping skulle gå genom nätverket och har den här killen fortfarande en minut kvar? Nu måste vi bygga och till och med rutt baserat på varje paket på internet. Det är ett - ledsen i ett mobilnätverk, som plötsligt nu är miljoner paket per sekund och något som växer om och om igen. Så ett fall är att varje applikation är att köra en fin liten sorts 2X per år. Inom vissa kunder ser vi: ”Men vänta, jag har en ny applikation. Jag vill lägga till vissa bedrägerier till min risk. Jag vill lägga till en djupare kundupplevelse till min bedrägeri och min risk. ”Var och en av dem skapar ny belastning på den underliggande databasen.

Robin Bloor: Ja, jag menar att jag tror att det var vad jag antydde på i den korta presentationen som jag gav, att dessa - vi brukade tro att en transaktion är, någon gör något och kanske finns det en kaskad av händelser och allt spelas in, och nu många transaktioner har en enorm mängd uppslag, och du gav några exempel i presentationen. Och därför kör du faktiskt inte en transaktion längre, du verkligen kör en typ av applikation som kan ha många, många element i den.

Den andra frågan innan jag överlämnar till Dez - eftersom vi uppenbarligen taggar teaming på detta - den andra frågan som jag skulle vilja att du ska svara om du har ett rimligt svar på det, är både Dez och jag förväntar mig att Internet av Saker eller Internet of Everything som det ibland kallas för att skapa en ganska dramatisk mängd transaktionstrafik. Kan du prata med det? Är det din upplevelse, har du fått kunder som kommer till dig med den typen av problem, och vad är din åsikt om detta just nu?

Brian Bulkowski: Visst, jag tror att det finns lite förvirring, och det är mildt sagt, om tingen Internet. De kunder som jag ser hittills tar helt enkelt internet till de saker de har. Tänk på Amazon-knapparna - allt är Amazon - dessa knappar, du kan inte återanvända dem och låta dem gå till Walmart online. Det är inte som en webbläsare som du kan blanda och matcha allt. Å andra sidan sker maskin-till-maskin, och när du ansluter din Tesla-bil för att ladda den, är Tesla ett enormt flöde av information, varje sensor i bilen, men den flyter in i Teslas dator för analys och förbättrad kvalitet . Det jag ser är att all den maskin-till-maskinen och alla sensorer inom ett enskilt företag skapar nya krav.

Nu mestadels idag, som flyter in i dessa analyssystem, och tar fallet med Tesla; Teslas första användning av detta, enligt min uppfattning, var att förbättra batteriets livslängd, under "Vilka driftstemperaturer är de, vad är belastningarna? Låt oss titta på det, låt oss designa ett bättre batteri. ”Men sedan börjar de tänka, och det är allt bra, det är en typ av djup analysproblem som är fascinerande, nästa fråga är:” Hur förbättrar jag upplevelsen från ögonblick för ögonblick ?”

Låt oss nu ta upp saken som Nest, där du försöker göra prediktiv analys för att ändra ett hems temperatur ögonblick. Det är den typen av fall där vi börjar se i Aerospike, där det finns denna enorma datasjö och där är det här enorma analytiska processer, men vad ska jag göra nu? Jag kommer att behöva behålla, tänk på det som kontanter, en del av den senaste veckan, den senaste månaden, kanske till och med bara de senaste dagarna värda av information, förmodligen på baksidan eftersom vi har att göra med enkel sensor enheter, och jag kommer att göra en uppsättning analyser på det ögonblicket för att ändra upplevelser. Den typen av bo-liknande upplevelser, en som jag ser Aerospike använda fall för.

Robin Bloor: Okej, det som jag förväntade mig med Internet of Things, var att du skulle börja få tröskelutlösare och att de skulle börja skapa kaskader av händelser. Har du sett något liknande, eller är det inte något du har sett ännu?

Brian Bulkowski: Dez och jag var - jag frågade bara Dezs åsikt om det när vi pratade för showen. Vad jag ännu inte har sett är den typ av kaskad av ett företags data som tränger in i ett annat företag, att mitt Samsung-kylskåp pratar med min LG-tvättmaskin eftersom det bara räknade ut att jag spillde en hel massa choklad över hela golvet, så den typen av företag till företag enhet för enhet, jag tror jag fortfarande väntar på det när det gäller Internet of Things. Jag tror att det finns vissa problem inom företag och säkerhet som oftast är icke-tekniska som måste besvaras för att se det.

Robin Bloor: Okej, december?

Dez Blanchfield: Jag har några mycket starka åsikter om den sista punkten faktiskt, som jag bara kort kommer att ta med i konversationen. Jag tror ofta att affärsverksamhet och teknik tror att de faktiskt kör dit efterfrågan kommer från, men när vi tittar på vad som hände när iPhone blev en sak, och i min mening var det typ av den första mobila enheten, om du förlåt ordspelet, men en enhet som kan transporteras runt som faktiskt kan köra massor av små appar i fickan, och det medförde en betydande omvandling av vad vi tänkte på att vara en dator. Många tänker på iPhones eller smartphones, eller Android-telefoner som telefoner, men de är inte, de är faktiskt bara en liten dator som kör appar, och en av apparna som den kör ringer, och de är inte samtal som vi tänker på längre, de är inte ett analogt punkt-till-punkt-samtal som Brian framhävde, de är små paket som blir dirigerade.

Men ofta än inte, vad vi har sett är denna försäkring av smartphones som faktiskt inte används för att ringa samtal som ofta, sannolikheten 98% av vad jag gör på min smartphone inte är att ringa. Det är allt annat än samtal, det är appar. Jag tror att denna kaskadeffekt - och jag är angelägen om att få detta till en fråga snabbt - men den kaskadeffekten skapas faktiskt av konsumenterna, och jag har faktiskt den här linjen som jag kastar ut ganska ofta för att få ett gäng CXO: er sitter uppe i rummet och uppmärksammar om jag tror att de somnar med presentationen jag gör, vilket inte händer för ofta, förhoppningsvis.

Jag sa det i den störningen som du ser i ditt företag faktiskt inte drivs av teknik uteslutande, det är ofta än att inte drivas av dina kunder. Och de sitter på samma sätt och undrar faktiskt, vad menar han där? Så när jag tänker på användningen av teknik, menar jag att vi såg USENET, vi såg alla dessa typer av roliga saker hända på internet, men inte många förutspådde sociala och effekterna av det.Alla som vill berätta för alla vad de hade till frukost, och det buller som skapade och backend-tekniken vi hade, och sedan försöker naturligtvis reklam fylla det med saker.

Jag tror att vi kommer att se en kaskadeffekt till en punkt där enheter pratar med enheter, konsumenterna bara fångar upp vad det faktiskt betyder och vad det kan göra. Du tog upp en intressant punkt om varför Amazon-knappen inte pratar med Walmart. Jag kommer att ställa den här frågan, vad händer när Walmart får sin egen knapp, och vad sägs om de tjugo Amazons och Walmarts och andra stora distributions- och detaljhandelsnätverk alla har sina egna knappar? Var tar det oss? Specifikt kommer min fråga med Brian att vara: ”Vart ska vi med detta helt nya prestationsparadigm? Du är i den blödande kanten av det och du arbetar med företag som gör det både på den fysiska infrastrukturnivån och på den överförande datanivån. Var tar detta oss när den här nästa stora vågen kommer? Vilken typ av insikt kan du dela med dig om det som händer i backend från din erfarenhet? "

Brian Bulkowski: Visst, hur jag tänker på många av dessa saker är att fokusera på användarupplevelserna och exakt vad du sa, det är användarna som driver, även om vi som teknologer och affärsmän kan komma på en smart idé om att vi tror att användarna gillar, och jag ska på ett sätt gå tillbaka till exemplet. När min syster installerade Nest i sitt hus, sa hon, ”Mitt hus är tystare, jag kan höra saker. Det är inte ens bara att jag betalar mindre för ström, ”är hon, men du kan nu inte rippa det boet från hennes händer eftersom hon gillar att vara i ett tystare hus i motsats till en där uppvärmningen blåser på maximalt och sedan stänga av.

Frågan slutar med att vara, vilka är användarupplevelserna som vi kan stärka? Det slutar vara den livskvalitetsupplevelsen, att om vi har pengarna och vi är i den första världen, skulle vi betala mycket för. Jag ger dig ett exempel från mitt eget hus, min flickvän gillar kall mjölk. Hon gillar riktigt kall mjölk, och så ofta måste vi försöka ta reda på var i kylen kommer att bli tillräckligt kall och inte att resten av sakerna överhettas. Det här är jättebra - och jag sa till min flickvän, "Skulle du betala 10 $ i månaden för att ha kall mjölk och inte ha frusna pålägg?" Hon var som "Absolut." Och att få $ 10 i månaden av alla konsumenter är tuff.

Jag tror att vi i dessa erfarenheter verkligen måste hålla ett öga på vad som är den konsumentupplevelse som verkligen skulle kunna drivas. Jag tror att det var en del av hemligheten med iPhone. Jag tror att det är en del av hemligheten med Tesla att bygga en bättre bil med all information, avskaffa idén om en produktcykel och en årlig utgåva och göra ständiga förbättringar på alla delar. Vi måste komma med några smarta idéer om hur man faktiskt kan använda alla dessa uppgifter på ett sätt som övertygar ögonblick för människors liv.

Dez Blanchfield: Ja, det är bra insikt. Vi fortsätter därifrån, den andra änden av spektrumet, som ekar exakt med det slags saker vi ser nu med vad konsumenterna ber om, och vi alla har något i huset som är kallt av det här och varmt av det. Den andra änden av spektrumet är då, och vi har sett detta i typ av den traditionella ”big data-världen” där datatilldelningar blir sällsyntare än höns tänder och de som finns på marknaden erbjuds mer än CIO: erna tjänar i vissa fall, de typer av företag du arbetar med och de typer av utveckling du har sett, är det så att typerna av utvecklare och typen av dataarkitekt och nätverkserbjudanden, blir de svårare och svårare att hitta ? Behöver vi organisationer som börjar tänka nu på att komma framför kurvan för den typ av kompetens som de behöver i baksidan för typen av utvecklare och dataarkitekter? Hur ser du på den nivån när det gäller kompetensresurserna som de kommer att förstå hur man använder den här tekniken till god användning nu?

Brian Bulkowski: Ja, jag tror att det är en av utmaningarna för de organisationer jag har pratat med. Oavsett om det är a - de värsta problemen som jag har hört talas om är faktiskt ett slags större företag, för om du säger: "Jag kommer från den här stora banken, jag kommer från Chase och jag var en dataarkitekt," Vi har världens din ostron och din lön går upp, så det finns detta problem med att få jobb på en av dessa platser eftersom det inte finns tillräckligt med människor och sedan kunna flytta från jobb till jobb. Jag hör ingenting annat än den typen av problem, och det är faktiskt ett av anledningarna till att jag har fokuserat Aerospike på att använda verktyg som är lämpligt för det specifika projektgruppen.

Istället för att försöka gå in i ett projektgrupp och säga: "Hej, du bör använda vårt frågespråk." Titta, om dessa killar, de kör bussen i dag, killar och gals, och om de använder ett visst frågespråk och verktyg, kommer de att hålla sig till det, och jag kan inte tala dem om något annat. Mitt mål är att kunna placera den typen av Aerospike-kraft som en databas bakom vilket verktyg de använder och det är en del av denna idé, bilderna du ser om framtiden för Poliglot-databasen. Jag måste stödja mönstren för applikation och analys mellan dessa killar, för det är verkligen svårt att försöka hitta människor som har den matematiska bakgrunden såväl som de statistiska förmågorna att navigera i denna värld.

Dez Blanchfield: En annan intressant sak som folk kanske inte är medvetna om, jag menar att Aerospike är en mycket stark aktör i öppen källkodsvärld, jag är angelägen om att få en mycket snabb inblick i vilken typ det betyder så långt som verksamheten fungerar och vad det gör för dig. Du nämnde att du arbetade direkt med folk som gör saker ända ner till kärnnivån inuti, så Linuxkärnan. Det finns några stora spelare som finns i detta utrymme, och det finns några kända varumärken som vi inte kommer att nämna, men en organisation som Aerospike, i din mer moderna senaste historia, open source-upplevelsen, hur passar det in i den stora bilden och vilka konkurrensfördelar har du sett som ger dig?

Brian Bulkowski: Visst, när vi övergick till open source 2014, gjorde vi det eftersom vi insåg att en kärninfrastruktur, som en databas måste vara källa tillgänglig, den måste lita på och en naturlig motbalans mellan den gamla världen av sluten källa, och när du investerar i en viss databas har dessa killar dig berömd för teknikcykeln efter teknikcykeln, och det måste finnas en balans. Vi måste kunna ta fram versioner som gör nya saker, och kanske det finns i en företagsversion, vi måste ha en dubbellicensmodell som har en öppen källkodsversion för personer som sparkar i däcken som gör ideella arbeten , liksom en företagsversion som är en licensinnehavare och som tillåter obegränsat arbete.

Och naturligtvis kommer vi också ha de högsta nivåerna av hastighet och skala, som en företagsversion. Vi tror på duelllicensmodellen och det har varit bra för vår verksamhet. Vi vill att folk ska komma igång med Aerospike, vi vill att små projekt ska sparka i däcken, det är superlätt att bara gå till Amazon, starta ett bekräftelseskript och ha ett Aerospike-kluster igång inom fem minuter. Å andra sidan vill vi ge mer till företagskunderna.

Dez Blanchfield: Vi är på nära håll nära toppen av timmen, så jag kommer att gå tillbaka till Rebecca om ett ögonblick, men om det bara fanns ett foder som du skulle kasta ut där, typ av råd du skulle ge till folk som vill komma in i rymden på den teknik du har fört till marknaden och hur de ska anta den, vad skulle du säga att det första steget för dem är att sortera åtminstone doppa tån och börja tittar du på hur de kommer att få en konkurrensfördel från din plattform?

Brian Bulkowski: Visst, en del av här är att det finns nivåer av hastighet och färdighet som nu är enkla. Du behöver inte en Cassandra-grupp med tusen noder för att uppnå miljontals transaktioner per sekund. Du kan göra det även i de första faserna av ditt projekt. Så saker är mycket lättare än de brukade vara. Då är det andra rådet du måste komma på, precis som du säger, matematiska affärsprocesser kundengagemodeller som använder alla dessa uppgifter, så de goda nyheterna är att uppgifterna är tillgängliga, dåliga nyheter är att du faktiskt måste hitta några mönster och några tvingande användningsfall.

Dez Blanchfield: Ja, bra råd, så jag kommer att lämna tillbaka till Rebecca nu. Tack så mycket för det, det var en fantastisk liten prat om tekniken, jag uppskattar det.

Rebecca Jozwiak: Tack, december Jag har ett par bra frågor från publiken. Låt mig kasta upp denna bild. Jag vet att du har pratat om systemet med skiv- och stordator-grejer, men hur ofta ser du absolut avlastning eller är replikationen en försoning i slutet av dagen, typ av vad du ser mer av?

Brian Bulkowski: Det vi ser i Aerospike använder en NoSQL-databas framför det avstämningssystemet i slutet av dagen. Du behöver intradag, rätt svar. Du kan inte ha fel svar, och det var vad Robin sa om tillgången är undervärderad, men affärsprocesserna kring de juridiska kraven för försoning kan bli ganska komplicerade och det finns decennier av teknik och decennier av lag och lagpraxis kring att göra försoning. Så det vi ser på Aerospike är att du kommer att göra dina algoritmer i en hetare databas med fler transaktioner per sekund. Men av juridiska skäl behöver du absolut ett försoningssystem som har genomgått de juridiska processerna. Vi ser båda, och vi ser att detta i huvudsak är den tvåskikts IT-praxis som de exponeras av människor som Anderson Consulting och Gartner i viss mån. Vi ser mycket av det.

Rebecca Jozwiak: Okay bra. Någon annan visade intresse för just denna bild, han sa att det var riktigt intressant och undrade om du bara kunde gå in i lite mer jämförande flash kontra i minnet.

Brian Bulkowski: Visst, låt mig ta en snabb sidofält igen, jag vet att vi är nära tidens slut. Tja flash är minne - det är chips - jag tenderar att tänka på RAM. Så RAM har speciella egenskaper, kräver mycket kraft, det är mycket bra på slumpmässiga skrivningar och slumpmässiga läsningar. Där NAND kan snabba slumpmässiga läsningar och lägre effekt, men det är väldigt dåligt vid slumpmässiga skrivningar. Det finns några subtila skillnader i hur dessa två chips fungerar på litografinivå, vilket skapar ett antal tekniska skillnader.

I det fall du gör analyser och du måste hoppa över mycket data, eller i Aerospikes-fallet, där du har index, är index fortfarande mycket bra att använda i RAM på grund av parallellitet och slumpmässig åtkomst. En högre nivå av slumpmässig åtkomst krävs. Men i Aerospike hittar vi att vi använder dessa index för att hitta ett visst objekt eller bit av data, det är rätt plats att nå ut till ett NAND eftersom det blir en större butik under indexen. Det är då en transaktion till en lagringsenhet, men ändå efter att ha gjort många potentialer och filter i ditt indexeringssystem.

Rebecca Jozwiak: Okay bra. Och då, jag vet att vi talade mycket om IoT redan och en deltagande kommentar sa att IoT till stor del är till nytta, men är företag, statliga enheter och utvecklare växer säkert och säkerställer data i samma takt, tror du?

Brian Bulkowski: Kanske Dez, vill du hoppa in?

Dez Blanchfield: Ja, jag är glad att hoppa in i den. Jag tror att svaret är nej. I själva verket är en av mina favorit kastade linjer om detta ämne mycket, mycket kort att jag tror att explosionen från maskin till maskin och allmän Internet of Things, kommunikation och säkerhet, risken kring det, vi är vid den punkt där nu regeringar kan inte hålla jämna steg med förändringstakten. Och i själva verket vet vi att många organisationer inte kan hålla jämna steg med förändringsgraden. Faktum är att om jag parafraserade det är förändringsgraden idag så stor att organisationerna måste s bara för att hålla jämna steg, men de måste göra det i flera lopp. Jag tror inte att lagen, och jag tror inte att regeringen i allmänhet, antingen statlig eller federal nivå, kan hålla jämna steg med förändringsgraden.

Nu är min allmänna råd till människor typ av handling nu och ber om förlåtelse senare. Det har varit många exempel på det tidigare. De kommer att komma ikapp, men jag tror att det verkligen är upp till affärs- och teknikleverantörer att slags innovationer i detta utrymme och se till att vi är bekanta med säkerhetsriskerna eller integritetsriskerna och att vi måste hantera dem. I synnerhet banker, som du nämnde, när du tänker på vad en bankorganisation traditionellt har gjort med saker som anti-penningtvätt och känner din klient, AML / KYC-utmaningen, brukade det vara att vart tredje till fem år skulle vi försöka och uppfylla efterlevnaden.

Nu tror jag att det måste byggas in i varje enskild transaktion. Du har alltid kunnat göra det på budnivå med reklam och aktie- och obligations- och aktiehandel, jag tror att vi är i den punkt där prestandan du skapar med Aerospike-plattformen gör att vi nu kan tänka på hur vi får integritet, hur sätter vi säkerhet in i den omedelbara beslutskedjan i realtid? Och så är svaret nej, jag tror inte att regeringar håller upp. Jag tror att företagen måste hålla jämna steg, och jag tror att vi måste agera nu och be om förlåtelse senare.

Brian Bulkowski: Låt mig lägga till ett par poäng också. De killar jag arbetar med, teknikföretagen jag hanterar, är mycket medvetna om att se till att de är på rätt sida av lagen, och en hel del av diskussionen är, är detta PII, kan jag använda detta, hur är Jag använder den här biten data? Vad var dess försyn, och är detta ett skyddat beslut eller erfarenhet? Hur gör jag allt detta? Så det är de goda nyheterna. Jag undrar ibland om vår diskussion som ett samhälle där vi är på väg, och om även vår samhällsdiskussion är på lämplig nivå när det gäller att använda de nya kapaciteterna från IoT hela vägen upp till maskininlärning, vilket är det enda sättet för att sortera genom de mängder data vi har. Men de goda nyheterna är att killarna jag pratade med verkligen är på rätt sida för att försöka göra rätt genom de rättsliga beslut vi har fattat.

Rebecca Jozwiak: Det här är några riktigt bra svar från er båda, och jag håller helt med. Jag tror inte att säkerheten går i lika snabbare takt som teknikutveckling, särskilt när det gäller Internet of Things, men jag måste tänka att människor gör sitt bästa och förhoppningsvis kommer vi dit. Det är alltid lite svårt att stanna tio steg före cyber-tjuvar och cyberbrottslingar, men vi kommer dit.

Tja folkens, vi har gått åtta minuter över timmen. Jag vill tacka våra gäster Brian Bulkowski från Aerospike och Dez Blanchfield och Robin Bloor. Tack så mycket. Du kan alltid hitta våra arkiv på insideanalysis.com, SlideShare, YouTube, vi har många bra webbsändningar som kommer, det har varit en hektisk månad. Det kommer att bli en hektisk månad nästa månad, så håll dig uppdaterad och vi hoppas att vi ses nästa gång. Tack folk, adjö.