Solid Community Workshop #6 – 29/04/2021

Solid Community Workshop

6 – datakluizen

29 april 2021

Algemene introductie

Filip Champagne volgt Katrien Mostaert op vanuit het Datanutsbedrijf als Solid product-owner.

Ruben Verborgh: Hoe werken datakluizen?

Solid is een standaard voor datakluizen, om data-gedreven innovatie terug te brengen. Mensen moeten diensten kunnen kiezen onafhankelijk van de identiteit en de data.

Wat is het idee van een datakluis?

Mensen zijn controle kwijt over hun data, dit zorgt ervoor dat data verspreid zit over verschillende bedrijven. Dit is slecht voor bedrijven maar ook voor burgers. We kunnen niet kiezen hoe we onze data inzetten op dit moment.

Controle

Controle als een toestemming om data eenvoudig te gaan hergebruiken op verschillende manieren. Solid gaat gaan standaardiseren tussen verschillende soorten van datakluizen en diensten. Nu is het vaak zo dat bedrijven succesvol zijn omdat ze veel data verzamelen, niet omdat ze innovatief zijn. Langs de andere kant zijn er veel bedrijven die willen innoveren maar dit niet kunnen.

Compatibiliteit

Wat gebeurt er als we data en applicaties willen gaan scheiden. Elke aanbieder van diensten moet compatibel zijn met elke aanbieder van datakluizen. Met dataverzameling gaan we niet ver komen in een dataeconomie. Solid zorgt ervoor dat verschillende kluizen, identiteiten, services kunnen gaan samenwerken. Dit doen ze door zich te baseren op bestaande webstandaarden. Datakluizen, applicaties en diensten en identiteit kunnen dus met elkaar verbonden worden.

Data pods als USB-stick

Data pods als USB-stick, deze kunnen samenwerken omdat er communicatie mogelijk is. Alle USBsticks zijn hetzelfde maar er zijn variaties in bv. Capaciteit, beveiligingmechanismen maar ze steunen wel allemaal op dezelfde standaarden.

Sleutelwoord in dit ecosysteem is complementariteit. Iedereen kan apps en datakluizen maken die bijdragen tot het ecosysteem.

Vragen

  • Solid is de standaard. Claimt er een andere speler/instelling ook deze insteek? En hoe komt het dat SOLID dit kan? (omdat SOLID de ideator is + neutraliteit + credibiliteit?)
    • Ook andere spelers claimen protocollen maar gaat meer over het platform. Bij Solid gaat het over webstandaarden. Dat is webscale denken. Wat hij sommigen ziet doen is eigen standaarden gaan uitvinden, dat niet zal werken omdat ze maar door een klein aantal spelers gedragen worden. Maar bij Solid kijken ze naar de basis en de traditie van het web dat voor een groot aantal spelers kan werken en zelfs de hele wereld.
  • Pods als USB sticks. Mooie vergelijking, maar hier thuis staat intussen een schoendoos vol met USB sticks. Hoe ga ik daarmee om?
    • Hebben over hoe we de technologie gaan inzetten. Net zoals we ook geen 100 toestellen hebben om over het web te gaan browsen moeten we dit hier ook vermijden. Maar dat zal ook afhangen van de use cases en hoe we dat gaan doen.
  • Is GAIA -X een voorbeeld van zo een platform approach? Ik zoek de connectie tussen beiden.
    • GAIA-X is een heel complex verhaal. Momenteel een lobbygroep voor data. Moeilijk om nu daar 1 enkele technische specificatie uit te gaan krijgen.

Stand van zaken

Tom Haegemans (Digita)

Digita als bedrijf dat gefocust is op Solid. Bieden software en diensten aan zodat bedrijven snel aan de slag kunnen met Solid. Klanten vooral overheden, banken en consortia.

Filosofie achter Solid om gedecentraliseerde data te gaan connecteren, ongeacht wie de eigenaar is. Doel van Solid is om alle gegevens te connecteren zodat gebruiker beter zicht heeft op haar gegevens.

Analogieën

Een paar analogieën bv. E-mail. Bij e-mail hebben we IMAP/SMTP als een open specificatie, bij persoonlijke data zal dat Solid zijn. Je kan als persoon meerdere mailboxen hebben, je kan ook meerdere pods hebben (bijv. voor persoonlijk gebruik en voor werk). Belangrijk is dat deze allemaal in dezelfde browser kunnen geconnecteerd worden met elkaar.

Koppeling tussen pods en identiteit enerzijds en met de applicatie anderzijds. Niet enkel mensen moeten toegang hebben tot die pods maar ook andere applicaties moeten toegang hebben (bv. Traditionele databanken). Om gebruikers te laten interageren met hun pods maken ze gebruik van Solid applicaties, enerzijds specifieke apps en anderzijds generieke apps om alle gegevens te gaan bekijken.

Hoe worden non-Solid pods gekoppeld? Dat kan door Solid middleware.

Use cases

Er zijn veel mogelijk opstellingen obv Solid. Hoe dat het wordt geïmplementeerd hangt af van de use case, gaat dit enkel binnen de grenzen van de organisatie of ook buiten de organisatie.

Twee typische use cases:

  1. Interoperable views: voorbeeld is databrowser waarbij je al uw Solid pods kan gaan integreren in één overzicht waarbij je goed kan zien wat er met je data gebeurt
  2. Data hergebruik: gebruiker staat centraal, dus vaak over hergebruik van data, om de gebruiker een naadloze digitale ervaring te bieden

Meer over Solid: www.digita.ai/resources

Vragen

  • Solid wordt mee door de overheid opgericht, maar ook bekostigd? Indien niet, hoeveel kost dit voor particulieren?
    • Heel goede vraag, er zullen onafhankelijke partijen zijn (data custodians) die pods zullen aanbieden aan gebruikers. Los van die data custodians of pod providers gaan er ook verschillende bedrijven zijn die een read-only pod gaan aanbieden aan de burger. Zeker niet beperkt tot onafhankelijke pod providers.
  • We richten helemaal niet mee Solid op als overheid. Wat we wel doen is het Solid initiatief ondersteunen, we gaan actief een infrastructuur opzetten. We willen hiermee de markt kickstarten. Wat het verdienmodel is of wat burgers gaan moeten betalen. Het gaat afhangen van de applicaties of iets betalend gaat zijn of niet, of gaat het dienst zijn die betalend gaat zijn. Vanuit overheid ook zelf bezig met een aantal use cases. Rol van de overheid om te kickstarten.
  • Is daar vanuit de overheid een visie voor data standaardisatie aanbod die ter beschikking komt van de burgers? (e.g. Standaardisatie van persoonsgegevens formaten en inhoud, etc…)
  • Ik denk dat er in elke use case het vraagstuk van standaardisatie aan bod komt. Is daar de overheid de enige partij? Absoluut niet. We hebben daar allemaal belang bij om de standaarden mee in de use cases te gaan krijgen. We moeten hier actief op werken binnen elke use case.
  • Waarom zou een bedrijf dat al op een berg data zit in Solid meestappen?
    • We zien dat er voornamelijk maar een beperkt aantal partijen zijn die gegevens in een pod van een persoon willen steken. Nu voornamelijk overheden, public interest organisations maar ook consortia (bv. Een sociaal secretariaat die vandaag al loonbriefjes ter beschikking moet stellen aan werknemers die heel veel incentive hebben om dat te doen). Andere use cases zien wij bij consortia van bedrijven, bv. De sector van organisaties, de sector van HR service providers kan zeer geïnteresseerd zijn in Solid om op die manier een gemeenschappelijke (interoperabele) storage aan te gaan bieden aan hun leden. Dus inderdaad veel cases die niet gaan over grote banken of supermarkten maar eerder over public interest organisations. Maar natuurlijk bij bedrijven zoals een grote bank wordt het heel interessant om die gegevens uit die pods te gaan halen dus zij moeten niet zozeer hun gegevens ter beschikking stellen maar zij kunnen daar wel mee van profiteren om bijvoorbeeld hun klanten makkelijker te laten onboarden enz.
  • Op uw (zeer informatieve) website wordt melding gemaakt dat bedrijven data over u in een data POD steken, maar dat ze data over u niet HOEVEN te disclosen. Welke redenen heb je hierbij in gedachten, doen ze dat dan door specifieke metadata aan die data te hangen, en kan er dan ooit een conflict ontstaan tussen de meta data die een bedrijf of die jezelf aan die data wil hangen?
    • Bepaalde bedrijven zijn terughoudend om zomaar gegevens van burger ter beschikking te gaan stellen aan persoon. Het zou goed kunnen zijn dat bedrijven zoals Delhaize alles in een pod gaan steken over een persoon maar misschien nog niet alles met de persoon zal delen bv. Aankoopgeschiedenis omdat dit misschien ook interessant kan zijn voor de concurrentie.
  • Er verschijnen enorm veel artikels, white papers. Ik stel vast dat er rond standaarden en dergelijke één standaard is die concreet is bij IEEE en dat gaat over “data trading systems”. Dus stel ik mij de vraag, of er geen andere soort van silo ontstaat dat die innovatie, die mogelijkheden voor die kleine startups niet gaat vervangen worden door het financiële (doordat die data enkel beschikbaar gaat zijn door ervoor te betalen)?
    • Ja, dat klopt, zeer terechte opmerking persoonlijk en nu spreek ik niet zozeer meer vanuit Digita maar ik geloof ook niet in data-monetisatie enzovoort. Ik denk dat het heel veel andere problemen met zich mee gaat brengen zoals bv. ongelijkheid.

Emmet Towsend: Inrupt

Today more about the blocks that make up an ecosystem. What do you need to make that actually real?

Key building blocks

Core things people have talked about is control. But what does that really take? When you put the infrastructure in place that only really works if you have these things in place from the beginning:

Control
  • Security build in into the design
  • Privacy: about me deciding what personal information I release, you need trust build in from the beginning
  • Consent: build into, should be very standard things that they are used to, the average person in the world should understand what they are looking at access control.

These should all be build-in from day 1.

Collaboration

This system will become useful when there is collaboration

  • Sharing
  • Search: now you search on what is only publicly available, this will change
  • Interoperability

Again these should all be build in the infrastructure from the beginning.

Innovation
  • Rich data sets
  • Interoperability
  • Portability
  • Developer tools
Competition
  • Open standards
  • Portability
  • Interoperability
Fabric
  • Availability
  • Scalability
  • Performance
  • Security
  • Interoperability
  • Trust ‘by design at the start’

Dit is een overzicht van de building blocks die er moeten zijn om dit alles te laten werken.

Underpinning success
  • Infrastructure (dit zijn de bouwblokken die hierboven vermeld staan)
  • Developer tooling
  • Collaboration
  • Tipping point: we moeten samenwerken om tot tipping point te komen
Vragen
  • En gemakkelijke toegang tot het gebruik van Solid, hoe moeten we dit concreet zien?
    • It is hard as a citizen because there are not a lot of applications out there yet. We have not reached the tipping point. At the moment, I would say there is a number of organisations working together to put that infrastructure in place and there are a number of use cases being worked on. For the average citizen at the moment, unless you are technical, there is not that interesting applications that you use on a daily basis that you can easily find. Right now we are still in the phase where the job is for the infrastructure providers and application providers to build the ecosystem to make it useful for citizens. And I think that is coming soon because some people here in the room are planning use cases.
  • Perhaps a mindblowing UX/CX app is key to reach the tipping point..
  • How does Solid (and Inrupt) tackle the semantic interoperability of the pod contents ? Is it left up to the users/implementers on top of Solid to come up with de facto standard ontologies, or will Solid facilitate that (through recommended profiles, …)
    • I can tell about the Inrupt plans. The important thing in ontologies are shapes and shape trees. Trees are building blocks that people share when building applications to allow interoperability. of data. The plan is to have a shape repository available to everybody but also available to contribute to. We need that to be searchable, findable and re-usable so in the beginning you will have companies help build shapes and provide it to everybody but over time they will start building in to that repository. So shape repositories with re-usability is the answer to your question. *

Frederic Lebeau: Datavillage

Behavioral data: all actions you do as a citizen online and offline. We connect these the behavioral data together in what they call the digital twin of the user. Organisations can ask questions and get answers but can not get the data, so in respect with the privacy of the user. How it works? See slide

Use case: Example of Media in an embedded user experience Digitaal Vlaanderen (solid)

Main focus on media and finance, trying to engage in different ecosystems (health and mobility). The mechanism can work for many other use cases.

Vragen
  • How does this provide a solution/an improvement for the USER compared to GDPR? As a user, you are still faced with too many consent actions.
    • My consents are linked to me. I don’t have to go in different places to give my consent. My consent is not spread over different places over the internet.
  • Are the derived insights fed back as well to the user pod?
    • It is still an open question. We don’t know today. We would like to get this feedback fed back to the user pod.
  • What vocabulary is used for actions?
    • Schema.org, it is maybe a bit basic but it makes the job. Later we can extend this with another ontology.
  • Is the business model of Datavillage comparable with Gener8ads.com. Control and be rewarded from your own data https://gener8ads.com/
    • Not at all, Datavillage will never process the data. The business model is based on a service provider. To make all this happen they need data in the pod. They ask an additional cost per provider if they do not add data back into the pod.
  • Is derived insight algorithm available for the user?
    • We want to show full transparency, example you get this recommendation because of this etc. All the processing and transparency is for us also part of getting in control of your data.
  • Can it also break the ‘information bubble’, and provide MORE information than what is decided for you?
    • We say that today you are locked by giants and by their algorithm as well. Your data is used in a silo, once you break data from other providers it will be about discovery (example now if you watch Netflix you get other recommendations but you can not have recommendations by VRT based on your history on Netflix).
  • How are/would you implement(ing) the right to be forgotten?
    • Only the derived data will come out. You have everything in your hands to be forgotten.
  • The risk for information bubbles will still remain there… It’s a psychological problem (people seek conformation, not counterfactuals by default – thinking fast)
    • Indeed, but nevertheless good to see recommendations.
  • Is the user all the time fully aware of their pod or vault?
    • Datavillage is not a pod provider, the user links the pod and is always aware of the pod.
  • Maybe I missed something; what is your business model? Who pays you; the individual or the service provider?
    • We do not get money yet. It will be free for the end-user. The service provider will pay and they plan to charge an additional cost if the service provider does not feedback into the pod.
  • Trust as a building block. But how will we do that?
    • Two levels: technical trust and mindshare trust. This second one is also build upon the behaviors of the people in the ecosystem.
  • Do we need more regulation?
    • Depends on the verticals. For some types of data, we do need more regulation.
  • I’m also interested in human behaviour research wrt this topic. Are there any insights available?
    • I’m Currently looking into the psychological literature research on datasharing (why, how, when). I already have some links to quite some research papers I can share.
    • From our research group at the University of Ghent we are doing the same.
  • General question: How can we work together on Solid as a private company?
    • As you got to build an ecosystem that underpins a data-economy and as we try to hit the tipping point, ultimately there is going to be a wave of people wanting to build their Solid applications. It would be incredibly useful if the integrators decided to upscale to build apps of that kind so that your approach is to bring expertise and skillsets into their clients.