Què vol dir “obert”?

benvolguts / benvolgudes,

durant uns dies heu estat aportant les vostres idees al voltant de les qüestions plantejades en l’exemple dels quatre amics que volen compartir un recull de notícies que hem usat per definir què vol dir “obert”. Primer de tot volia agrair-vos la vostra participació, que és la que realment fa que un curs com aquest funcioni; entre tots heu construït un munt de coneixement i jo ara amb aquest missatge intentaré posar una mica d’ordre, responent a les mateixes qüestions plantejades i aprofitant per anar enllaçant temes. No us espereu una resposta “definitiva”, com sempre les coses no són ni blanques ni negres i sempre hi ha zones grises.

1) Quines de les 5 Rs fan els nostres amics amb les notícies?

Fixeu-vos que aquí la pregunta ja presenta una ambigüitat respecte a l’escenari plantejat: estem parlant de notícies com a contingut o bé de l’enllaç a la notícia? En funció del que un entengui per contingut, els nostres amics fan unes coses o unes altres. No vull allargar aquest debat innecessàriament, suposarem que el contingut que els nostres amics utilitzen és tan la notícia com el seu enllaç.

Aleshores, els nostres amics REUSEN la notícia, perquè bàsicament hi accedeixen per decidir si és prou interessant o no. Estareu d’acord que no enllaçaran una notícia que no han vist, oi? De la mateixa manera, si la notícia no haguès estat accesible mitjançant un enllaç no podríen haver-la seleccionat pel seu recull. De fet, si un contingut és obert, el simple fet d’accedir-hi i fer qualsevol cosa amb ell ja implica executar la primera R.

Els nostres amics REVISEN el contingut de la notícia perquè extreuen (computen ells mateixos) unes paraules clau, a banda d’usar la seva data i hora, l’enllaç, etc. Imagineu-vos que en lloc de paraules clau haguèssim parlat d’un “resum”, potser aleshores seria més clar que estan “transformant” la notícia en una altra cosa, però la idea darrera de revisar és la mateixa. De fet, aquesta R inclou tantes possibilitats (traduir, adaptar el format, calcular, …) que és també una de les operacions habituals.

Els nostres amics NO REMESCLEN dues notícies per fer-ne una de nova, les processen una a una. Ara, si imagineu que publiquen petits reculls en paquetets per tema (p.e. “política”), sí que podríem entendre que remesclen el contingut original (cadascuna de les notícies) creant un de nou (el paquetet). Aquesta R juntament amb l’anterior van de la mà molts cops, perquè són dues operacions complementàries. P.e., si els nostres amics utilitzessin imatges per il·lustrar les notícies, podrien agafar una imatge d’un lloc i usar-la per una notícia (com fan els periodistes amb les imatges d’arxiu).

Arribem a la R més complicada; tal i com us deia, no és el mateix fer un “corta y pega” de la notícia que només compartir el seu enllaç. Els nostres amics REDISTRIBUEIXEN enllaços (i alguna cosa més), però realment no redistribueixen les notícies. El nostre objectiu era òbviament forçar la discusió perquè aquest punt és de fet clau i quan parlem dels aspectes legals tornarà a aparèixer.

Finalment, amb la cinquena R passa una cosa semblant a l’anterior; els nostres amics RETENEN l’enllaç, però no la notícia. Recordeu que Google (que se suposa que gestiona continguts accessibles mitjançant enllaços) oferia poder veure una pàgina encara que aquesta ja no existís mitjançant l’ús d’una còpia? I això els va causar problemes perquè els “enllaçats” es queixaven de que Google duplicava continguts sense permís. En parlarem també quan discutim sobre temes legals.

2) Quin(s) rol(s) adopten els nostres quatre amics pel que fa a les notícies, són productors, consumidors i/o mediadors?

Els nostres amics NO SÓN PRODUCTORS notícies, produeixen reculls de notícies. En aquest sentit, són MEDIADORS, ja que faciliten l’accés a unes certes dades. És pot ser mediador sense consumir? Bé, per fer una truita hem de trencar els ous, el tema és qui es menja la truita, en aquest cas podem pensar que si els nostres amics fan uns reculls de notícies que ells aprofiten pel que sigui, aleshores també SÓN CONSUMIDORS, però si només ho fan per a tercers, aleshores no ho són.

3) Quin tipus de document penseu que podríen usar per a emmagatzemar la informació sobre les notícies que recullen?

Heu donat moltes opcions, algunes molt senzilles (un document o una pàgina web) i d’altres un punt complicades (una base de dades). De fet, per compartir data, hora, paraules clau (suposem que hi ha un màxim de paraules clau) i un enllaç, amb un full de càlcul és suficient. Ara, si volem que l’enllaç sigui “clicable” i anar a la notícia, o bé fer cerques per paraula clau o alguna operació més complexa, sí que aniria bé ja pensar en una petita aplicació que gestioni enllaços. P.e. podrien haver usat un blog, fent una entrada per cada recull, agrupant una o més notícies. Però també podrien haver usat serveis com delicious o diigo, orientats exactament a compartir enllaços.

4/5) En lloc de compartir les dades amb tothom lliurement a través de la carpeta compartida, “podríen” (en un sentit ampli) els nostres amics cobrar per facilitar la informació que ells recullen a tercers? Podrien els propietaris dels canals tradicionals de comunicació que ells usen com a font queixar-se de l’activitat dels nostres amics per il·lícita o competència deslleial? I, encara més interessant, podrien aprofitar-se’n?

Bé, “poder” podrien fer-ho, però dubto que si no afegeixen realment valor algú decideixi pagar pel servei ofert. De fet aquest és el canvi de xip que hi ha darrera dels models de negoci: no és fàcil vendre dades (obertes o no) com a producte, cal convertir-ho en un servei que sigui interessant pels usuaris finals.

La resposta a la segona pregunta és més complicada, perquè podem trobar les dues postures: o bé pensar que els nostres amics s’aprofiten de la feina dels altres i treure un benefici o bé, com alguns heu apuntat, pensar en l’iniciativa dels nostres amics com un nou recurs que aporta visibilitat a contingut ja existent. Un altre cop Google ha tingut un munt de problemes amb proveïdors de continguts que l’acusen de beneficiar-se sense fer res, quan realment Google genera un munt de tràfic a moltes webs que, sense Google, serien invisibles. Trobar l’equilibri passa un cop més per diferenciar-se aportant un valor afegit.

6) Coneixeu alguna experiència similar?

Heu mencionat molts, i també heu identificat correctament que no són exactament el mateix, com ara menéame (o la versió anglesa digg), scoop.it!, etc. Els nostres amics no són tan originals com es pensen i segurament han intentat reinventar la roda, com passa molt cops.

Resumint, un contingut (unes dades) serà més o menys obert en funció de més o menys Rs que podem executar sobre el mateix. El que us proposo ara és identificar barreres que poden impedir que executem alguna de les Rs; de les vostres respostes derivarem la conversa cap al que discutirem més endavant sobre aspectes legals i tecnològics. Us poso un exemple directament relacionat amb els nostres amics:

És imposible Reusar si l’enllaç compartit pels nostres amics porta a una web que demana un usuari i un password per accedir al contingut (p.e. serveis premium de molts diaris). Així doncs, la barrera és no poder accedir al contingut. 

Quines altres barreres podeu identificar a l’exemple dels nostres amics o qualsevol altre que coneixeu?

Esperem les vostres aportacions! I si voleu comentar res sobre la “solució” que hem presentat en aquesta entrada no dubteu en fer-ho també en aquest mateix espai.

Julià

VN:F [1.9.22_1171]
Rating: 8.8/10 (4 votes cast)
Què vol dir "obert"?, 8.8 out of 10 based on 4 ratings

23 pensaments a “Què vol dir “obert”?”

  1. Se me n’acudeixen dues:

    – El llicenciament de continguts. En funció del tipus de llicència dels continguts, se’ns podria prohibir una o més de les 5R’s

    – També el format de les dades, pot posar-nos impediments. Hi ha formats “propietaris” que no ens permeten redistribuir sense pagar llicències o altres que fan necessari un visor específic

    VA:F [1.9.22_1171]
    Rating: 4.0/5 (3 votes cast)
    1. Jaume,

      Efectivament les llicències i, anant una mica més enllà, les “normes de reutilització” (no només les llicències) poden ser un impediment.

      Ara fa dos anys vaig estar a Budapest defensant la necessitat de tenir unes “normes de reutilització” úniques per a tots els portals de dades obertes d’Europa.

      Resulta molt difícil poder reutilitzar dades de diferents portals quan aquests tenen diferents “normes de reutilització” i, fins i tot, contradictòries!

      VA:F [1.9.22_1171]
      Rating: 0.0/5 (0 votes cast)
  2. Hola,

    a més de les barreres a les 5Rs que ha indicat en Jaume, se m’acudeixen les següents:

    – Les competències o el coneixement per fer-ho: a banda d’algú que no estigui alfabetitzat per fer aquestes operacions, imaginem-nos que comporten i fins on es requereixi arribar en cadascuna. Per exemple, Revisar, pot suposar adaptar a un format o traduir-lo; Remesclar, pot voler dir tenir capacitats analítiques o de síntesi… Pot ser que el canal o el context on volem posar aquesta informació ens demani certs requisits que hem de complir.

    – A més de les llicències de continguts (Creative Commons…), també ens podem trobar amb un copyright, que no ens permeti fer res.

    – Com ja s’ha dit, de vegades, el pressupost per pagar determinats tipus de llicències o royalties.

    – I com ha dit en Jaume, també, els requeriments tècnics entre formats o visors, o fins i tot, la compatibilitat entre aplicacions. De vegades, si no suposen directament una barrera, compliquen aquestes operacions.

    – Seguint amb el tema tècnic, un virus, pot afectar un o més dels nostres fitxers, i deixar inoperativa qualsevol de les 5Rs.

    – O la desactualització o incorrecció en els enllaços que retenim o redistribuïm.

    – I possiblement, fins i tot, algun cas que afectés el codi deontològic o infringís alguna llei… Per exemple, si publiquéssim dades personals o sensibles emparades per la llei, possiblement no només la font original hauria de complir amb la normativa.

    I bé, no sé si me’n deixo alguna…

    Fins aviat!!

    Mercè

    VA:F [1.9.22_1171]
    Rating: 5.0/5 (2 votes cast)
  3. No se m’acudeixen gaires més barreres, legals o tecnològiques, a part de les que comenta en Jaume. A no ser que no disposar d’accés a Internet es consideri la principal barrera per tal de no poder exercir cap de les 5 Rs sobre el contigut distribuit pels nostres amics.

    L’idioma o el nivell intel·lectual dels articles seleccionats també podrien ser barreres (però d’un altre tipus), concretament per a la seva comprensió per part dels usuaris. Però se suposa que les notícies haurien estat seleccionades seguint uns criteris que haurien fixat aquests paràmetres.

    Una abraçada!

    VA:F [1.9.22_1171]
    Rating: 5.0/5 (1 vote cast)
  4. M’inclino també pels drets d’autor/llicències no infringint cap. Que tant el format utilitzat per emmagatzemar les dades com l’eina que utilitzarem per a tractar-les el trobem en modalitat oberta (no pagament) i poder tenir la capacitat i formació necessària per a poder interpretar-les. Podem estar envoltats de dades lliures que si no sabem el que volen dir, no té cap sentit.
    No és el cas de l’exemple però, una altra barrera podria ser que no poden ser dades identificatives, és a dir, que amb la seva publicació no posem en perill l’anonimat (històrial mèdic, dni, adreça,..). Entenc que es tracta de dades amb un cert grau d’agrupació.

    VA:F [1.9.22_1171]
    Rating: 5.0/5 (1 vote cast)
  5. Seguint en la línia tecnologica que heu marcat, la tria del format de presentació de les dades,

    Per exemple (i fugint un moment del cas dels amics), si l’INE publiqués les seves dades en pdf i sense OCR .crearia un obstacle (salvable, pel que tinc entès) per a la seva reutilització.

    VA:F [1.9.22_1171]
    Rating: 5.0/5 (1 vote cast)
    1. Vidal,

      El gran enemic de les dades obertes és el format PDF.

      Les dades s’obren per a que siguin reutilitzades (aquesta afirmació és evident, però convé recordar-la donat que moltes suposades “dades obertes” s’han obert en alguns formats – especialment el PDF – que NO permeten la reutilizació).

      És cert que alguns documents PDF se’n poden extreure les dades… però és complex de fer i només és per un subconjunt petit de documents PDF.

      L’adequat és proporcionar les dades en un format reutilitzable.

      VA:F [1.9.22_1171]
      Rating: 0.0/5 (0 votes cast)
      1. d’això en parlarem ben aviat quan discutim els aspectes tecnològics lligats a les dades obertes

        salutacions

        Julià

        VN:F [1.9.22_1171]
        Rating: 0.0/5 (0 votes cast)
        1. En relació a les barreres ‘tecnològiques’ que impedeixen/dificulten l’accés a la informació i, més concretament, en relació al format PDF al qual ja hem fet referència (“el format PDF no permet la reutilització”):

          > Si bé és cert que aquest format NO és pas l’ideal a l’hora d’aprofitar la informació i extreure’n les dades (i molt menys fer-ho de forma automatitzada), cal dir que és possible treballar amb dades que només existeixen a dia d’avui en format PDF. És més costós, és un procés manual i gairebé artesà, però existeixen tècniques i programes que ho fan possible.
          Eines com el Free-OCR (http://www.free-ocr.com/) o com el Zamzar (http://www.zamzar.com/) que permeten extreure dades de formats “tancats” són un parell de possibilitats quan no disposem de dades obertes en el sentit ideal del terme.

          No obstant i en la meva opinió, és ben cert que moltes de les dades que trobem per internet a dia d’avui i que encaixem dins del concepte ‘obert’ no ho serien pas en el sentit estricte del terme ja que només ho són amb uns certs condicionants (inversió de més temps, coneixements avançats en l’extracció de dades, etc.).

          Salut

          VA:F [1.9.22_1171]
          Rating: 0.0/5 (0 votes cast)
  6. Em sembla que poc més es pot afegir als comentaris anteriors, en els que, penso, que ja s’han descrit totes les barreres que hi ha. Només volia afegir que, la majoria de barreres són fàcilment salvables, la majoria de vegades ens compliquem sense necessitat!

    VA:F [1.9.22_1171]
    Rating: 2.0/5 (1 vote cast)
  7. Aprofitant que he aconseguit posar-me més o menys al dia…

    Entenent el terme “barreres” com allò que dificulta però no impedeix les 5R (hi ha qui no pot i qui vol franquejar-les, però hi ha qui sí), m’adhereixo a les barreres tecnològiques i legals que ja s’han comentat.

    Tot i així una limitació que em preocupa més és la manca de capacitat que podem tenir tots per a fer-nos una visió completa del que requereix i significa obrir contingut, especialment en quant a implicacions legals i en quant a possibles conseqüències. En aquest aspecte, m’agrada la reflexió que genera el cas de les dades de cerca de AOL (encara que llavors el terme BigData no estava de moda): http://en.wikipedia.org/wiki/AOL_search_data_leak

    VA:F [1.9.22_1171]
    Rating: 2.0/5 (1 vote cast)
  8. hola a tots,

    bé, heu esmentat moltes de les barreres, podríem intentar endreçar-les una mica en funció de la R que obstaculitzen:

    Reutilitzar: si no podem accedir al contingut (les dades), pot haver hi moltes raons com les que heu esmentat

    Revisar: si el contingut no permet fer modificacions, ja sigui perquè està distribuït sota una llicència que no ho permet o perquè està en un format que no ho facilita

    Remesclar: és com el cas anterior però tenint més d’un contingut, com veurem en el cas de llicències això acostuma a ser un maldecap!

    Redistribuir: un cop més la llicència és la principal barrera, però també la manca de mecanismes on publicar el nostre contingut revisat (tot i que realment n’hi ha moltes, d’opcions)

    Retenir: és com el cas de la primera R, de fet un cop accedim a qualsevol contingut, copiar-lo (digitalment) no hauria de ser un problema, però pot tenir un format que no ho faciliti, p.e. dades escampades en desenes, centenes o milers de pàgines web, o bé fitxers log de centenars de GB, aleshores “copiar” esdevé un problema

    en les properes setmanes analitzarem per una banda els aspectes legals lligats a les llicències, drets de propietat intelectual, etc. i, per altra banda, les eines disponibles per a superar o minimitzar les barreres tecnològiques

    salutacions

    Julià

    VN:F [1.9.22_1171]
    Rating: 5.0/5 (2 votes cast)
  9. Hola,

    Heu parlat de moltes barreres que impedeixen l’obertura de les dades. La majoria del que heu comentat són barreres tècniques.

    Però us heu deixat un altre tipus de barreres: les organitzatives i/o les polítiques.

    En molts casos les dades no s’obren degut a que internament l’organització – habitualment una administració pública – té una pèssima gestió de dades, això provoca que qualsevol canvi – gran o petit – sigui inabordable.

    És un problema organitzacional i molt comú en les nostres organitzacions (no en totes).

    D’altra banda, també existeix una altra barrera: la política.

    Sovint ens trobem que algunes dades no es volen obrir perquè el responsable polític té por que li “treguin els colors”.

    Personalment no m’he trobat en gaires casos d’aquest estil. Sí que m’he trobat en molts casos de l’anterior cas: de problemes derivats de tenir una mala gestió interna de les dades.

    VA:F [1.9.22_1171]
    Rating: 4.0/5 (1 vote cast)
  10. Només una observació, en parlar de quines de les cinc R fan servir els nostres amics de les notícies, a la introducció d’aquesta entrada, he llegit literalment “no és fàcil vendre dades (obertes o no) com a producte, cal convertir-ho en un servei que sigui interessant pels usuaris finals”.

    No sé com ho veureu la resta però sovint als diaris trobem notícies relacionades amb hackers informàtics que es fan amb dades per després vendre-les, vull dir que tant difícil no penso que sigui.

    No sé ben bé com funciona aquest mercat, no hi estic posat, però pel que es veu existeixen mercats on es comprem i vénen dades, potser no amb finalitats gaire lícites, però d’existir mercat penso que sí que existeix.

    VA:F [1.9.22_1171]
    Rating: 3.0/5 (1 vote cast)
  11. Posant en ordre el que hem exposat, ¿podem arribar a categoritzar les barreres en aquestes 5C (categories)?

    – tècniques
    – organitzatives
    – polítiques
    – gap digital (accés físic, habilitats/coneixements, …)
    – privacitat/anonimat

    VA:F [1.9.22_1171]
    Rating: 4.0/5 (1 vote cast)
    1. interessant, Jaume, no veig clares les categories però segurament podríem fer un esforç; jo ho deixaria en barreres tecnològiques, legals i “organitzatives”, en aquesta darrera categoria podrien entrar moltes altres (p.e. les polítiques que tu esmentes)

      salutacions

      Julià

      VN:F [1.9.22_1171]
      Rating: 0.0/5 (0 votes cast)
  12. Hola,
    Una barrera a nivell general i social també podria ser la escassa cultura de dades que hi ha en aquest país. Llavors tot el tema d’open data hauria de formar part “natural” del procediment administratiu i no ser tractat com a una excepció.

    VA:F [1.9.22_1171]
    Rating: 2.0/5 (1 vote cast)
  13. A banda de barreres com les d’estandardització i el seu condicionament per a reutilitzar, que ja s’ha dit, diria que les barreres poden ser valors. És a dir, abans d’obrir dades hi hauria d’haver un filtre per assegurar si quan obro una dada estic creant indefensió a un ciutadà (p.ex. obrint dades de caràcter personal) o consumidor o bé un problema a nivell de seguretat (p.ex. fent públics els seus moviments).

    VA:F [1.9.22_1171]
    Rating: 3.0/5 (1 vote cast)
  14. A nivell mundial, la barrera més gran per accedir son els recursos econòmics tant de cara a la producció d’informació com a l’accés. Encara que sembli que el format obert es sinònim de gratuït, no es així, ja que es requisit indispensable comptar amb un dispositiu i infraestructures que permetin l’accès a aquesta informació. D’altre banda, alhora de produïr, les noticies queden condicionades als individus i grups que tenen suficient capacitat per produir-les aïllant de forma indirecta als que no reuneixen els recursos. Trobo que aquesta es la barrera més gran de cara a la distribució de informació “oberta”.

    VA:F [1.9.22_1171]
    Rating: 2.0/5 (1 vote cast)
  15. Molt clarificadora la resposta. En quan a la questió de les barreres, se m’acut que no seria possible “reusar” si l’enllaç dels nostres amics porta a un lloc il·legal (vull dir que els continguts han estat obtinguts il·lícitament, per exemple fotos robades o a partir d’un fet delictiu). Si els continguts inclouen dades personals, caldria veure si s’han obtingut autorització dels interessats per utilitzar-les, i si són o no dades sensibles i per tant més protegides.

    També hi ha algunes eines tecnològiques que podrien ser un obstacle. Per exemple marques d’aigua a les fotografies.
    En quant a les llicències, tipus cc o color iuris dependrà de les condicions específiques.

    Fins aviat,

    VA:F [1.9.22_1171]
    Rating: 0.0/5 (0 votes cast)
  16. El problema de l’accés també pot contenir altres barreres:
    1) Com per exemple una web que no sigui accessible, que no sigui apta per a invidents. Això vol dir que mai podran accedir als continguts.
    2) També pot plantejar problemes l’idioma (la traducció automàtica del xinès al català no sé si funciona bé) i per tant no s’accediria correctament a les dades.
    3) Una altre barrera és el fet que hi hagi censura sobre Internet (parlant de Xina, de tant en tant bloquegen determinades cerques, paraules, adreces a internet, etc…), i no és l’únic país que ho practica, amb la qual cosa també tenim una important barrera que distorsiona o, directament, impedeix la aplicació de les R’s.
    4) També són una barrera la manca d’accés a internet i la manca d’accés i coneixement de les NTIC.
    5) L’atribució de llicències, drets de copyright, etc… a les dades posades a Internet.
    6) I una molt important per a mi: el format en què es presentin aquestes dades. Si estan fetes en una aplicació que ens permeti fer el procés i refinar-les, les podrem utilitzar i extreure’n alguna informació. Però moltes vegades les dades estan en PDF’s i això fa molt més difícil la seva utilització.

    Així doncs, les quatre primeres ja invalidarien l’aplicació de qualsevol de les R’s. La cinquena depèn justament de les llicències que tinguin atorgades les dades. I la sisena permetria reutilitzar, redistribuir i retenir l’original, però fa més difícil revisar, remesclar i redistribuir un contingut que s’hagi modificat ja que el procés de dades massives obtingudes en PDF és molt complicat i moltes vegades no paga la pena.

    VA:F [1.9.22_1171]
    Rating: 0.0/5 (0 votes cast)
  17. Existeix encara dins les organitzacions la idea que “informació és poder” i es difícil i lent modificar la mentalitat i fer entrar en el subconscient col·lectiu conceptes com reutilitzar, compartir, obrir.

    Per sort en poc temps sembla que la idea va calant, però costa, costa….

    Crec que és una barrera important.

    VA:F [1.9.22_1171]
    Rating: 0.0/5 (0 votes cast)
  18. Una barrera per redistribuir els enllaços de les notícies podria ser que l’enllaç de la notícia fos molt llarg. Hi ha enllaços que són molt llargs i això comporta que emmagatzemar-los i redistribuir-los sigui més problemàtic.

    VA:F [1.9.22_1171]
    Rating: 0.0/5 (0 votes cast)

Deixa un comentari

L'adreça electrònica no es publicarà. Els camps necessaris estan marcats amb *