De la Privacidad en Internet

Febrero 12, 2010

Recientemente, la privacidad de la información en Internet ha llamado mucho la atención, cuestionando el manejo de los datos de ciertos sitios y las herramientas que tienen las personas para proteger la información que no desean que sea pública. En general, este interés es causado por los cambios en las políticas de páginas Web donde el usuario mantiene información personal, o en el lanzamiento de nuevos productos y sitios con políticas de privacidad muy cuestionables.

A modo de ejemplo, podemos hablar de los cambios en las políticas de privacidad de Facebook, haciendo público cierto contenido personal de sus usuarios, permitiendo que ciertos datos (status, fotos, etc.) puedan ser vistos por cualquier persona, sin necesidad de tener una cuenta registrada en dicha red social. A esto se le debe agregar que su fundador, Mark Zuckerberg, afirmó en una entrevista que “la era de la privacidad online está muerta“, comentario un poco fuerte para alguien que tiene en su haber (relativamente hablando) información de millones de personas y empresas. Podemos también hablar de productos como Google Latitude y más recientemente Google Buzz, que permiten al usuario no solo compartir mensajes, sino geo-localizarlos y adjuntar fotos o videos, así como ver los mensajes de gente que esté cerca de mi ubicación actual. Por si fuera poco, han armado un Gran lío por publicar los contactos de cada usuario, agregando en primer lugar a los contactos con quienes se interactúa más, en un error (quiero pensar que fue un error) de hacer pública información privada del usuario, y de manera automática.

Aprovechando que este tema está dando mucho de qué hablar, quiero compartir ciertos puntos que leí hace algún tiempo en un artículo donde los autores hacían un balance entre la oferta de personalización vs la privacidad del usuario. En este artículo, hablaban de ciertas “Reglas de Oro” para ofrecer personalización al usuario, manteniendo su privacidad y, más importante, respetando las leyes de privacidad que puedan estar involucradas. Estas reglas están tomadas de varias leyes de privacidad aprobadas por la Unión Europea:

  1. Consentimiento del usuario o anonimidad: para cualquier información personal almacenada y publicada, se necesita la autorización y consentimiento previo del usuario, o su anonimidad en caso contrario. Este punto tiene como requisito algo bastante interesante: cada usuario que no fuera ser considerado como anónimo, debe ser correcta y sistemáticamente “identificable”, por medio de logs, origen, o algún otro medio aceptado.
  2. Retiro del consentimiento del procesamiento de la información: este punto trataba más sobre la personalización (al menos en el artículo), pero habría que ver su aplicación en otras áreas. De todas maneras, este punto dice que, en todo momento e incluso en la sesión actual, el usuario puede retirar su consentimiento previo para que el sistema utilice su información (de tráfico y ubicación geográfica) y evitar que exista una personalización respecto a estos datos.
  3. Cuáles, por qué y por cuánto tiempo? El usuario tiene el derecho de saber cuál dato será utilizado por el sitio, con qué propósito y por cuánto tiempo, y si la información será compartida a terceros, con previa autorización para hacerlo. En otras palabras, no es sólo de informar al usuario que se usará su información, sino que al informarle debe ser muy específico.
  4. Información personal sin agrupar: la información personal obtenida para un propósito específico, no puede ser agrupada para proveer otra personalización. Un claro ejemplo de esto es Google. Google tiene varios servicios con diferentes propósitos, este punto lo que dice es que no se debe poder agrupar esta información con otros nuevos fines.
  5. La información respecto al uso debe ser eliminada después de cada sesión: con excepciones, los datos respecto al uso de la información que no se haya aprobado, debe ser eliminado inmediatamente.
  6. Prohibición de la automatización de las decisiones del individuo: me permito citar el artículo pues me parece bastante importante: “No fully automated individual decisions are allowed that produce legal effects concerning the data subject or significantly affect him and which are based solely on automated processing of data intended to evaluate certain personal aspects relating to them, such as their performance at work, creditworthiness, reliability, conduct, etc.”. En pocas palabras, la automatización obviando el poder de decisión del usuario está prohibido.

Curiosamente, no creo que exista una sola aplicación que cumpla con todos estos requisitos. Peor aún, se podría decir que Google falla de alguna manera en todos ellos. La automatización en Google Buzz es sin lugar a dudas un fallo tremendo al punto 6. En mi opinión personal, todo esto tiene un gran “SE SUPONE QUE…”, pues no creo que se cumpla al pie de la letra.

En resumen, la idea (y lo ideal) sería que los servicios y aplicaciones pueden almacenar información privada de los usuarios con la previa autorización de éstos, con la premisa que dichos usuarios deben ser identificables. Además, los usuarios deben saber específicamente qué información se almacena y se utiliza y con qué fin. Finalmente, los servicios deben proveer al usuario las funcionalidades para modificar y borrar su propia información. Google, al que muchos llaman el gran enemigo en este sentido, lanzó recientemente su Dashboard, un portal donde se puede ver y administrar toda la información personal que tiene esta compañía de uno. Es al mismo tiempo interesante e impresionante (da un poco de miedo, la verdad) ver todo lo que saben de uno.

saludos!

La Web Ubicua

Junio 3, 2008

Mucho se habla y se ha hablado en los últimos años acerca de la “Web 2.0″, de blogs, comunidades y start-ups que han venido a revolucionar no solo el Internet sino nuestros hábitos personales y comerciales. Sin embargo, dicho término no nace por una segunda versión o generación del Internet, sino que nace como un término confuso que unos utilizan para definir interactividad del usuario, contenido generado por el usuario, utilización de tecnologías ajax, y especialmente como un término para marketing. Esto ha creado todo un ejercito online que se dedica a generar y desarrollar ideas - que en mi opinión es la parte buena - o que “generan” (o copian) contenido de manera excesiva con el único fin de posicionarse “alto” - que para mí es la parte mala, la del marketing - para luego sacarle un provecho económico. Esto ha llevado a que muchos se pregunten qué hay más allá de la Web 2.0, y obviamente obtienen una respuesta sencilla y trivial: Web 3.0.

Esto personalmente es algo que a mí me molesta, porque es una manera de adelantarse a los hechos a veces por una tonta idea de querer ser los “primeros” que lo mencionan, cuando en ocasiones con comentarios así dejan ver que ni siquiera comprenden a lo que se le llamó 2.0. Obviamente escribo este post tratando de ser lo mas cauteloso posible para no caer en lo mismo, y por eso he titulado el post como “Web Ubicua”, el concepto detrás de la visión de red de Sir Tim Berners-Lee, inventor de la World Wide Web.

Para comprender mejor el concepto de Web Ubicua, es importante comprender a sus antecesores. La Web inicial contenía archivos HTML estáticos descargados por los usuarios para obtener información, en términos numéricos ésta vendría siendo la Web 1.0, aunque insisto en que no soy muy partidiario de dicha numeración. Con el tiempo apareció CGI que dió paso a lenguajes de programación que generan contenido dinámico, permitiendo aplicaciones Web mucho más ricas y útiles, dando paso a la Web dinámica. Este dinamismo es el verdadero culpable de la 2.0, un concepto de interactividad, más que una tecnología concreta. ¿Cuál es el siguiente paso, entonces? Según Berners-Lee, una Web ubicua donde exista una interacción que incluya el espacio y el contexto, una Web que “comprenda” y que esté “en todos lados” - de allí el término ubicua.-

¿Qué significa esto? No me atrevo a definirlo, sin embargo si puedo nombrar ciertos proyectos, tecnologías y estándares que pueden dar una idea:

1. Computación en todos lados: es curioso ver como la computación ha evolucionado desde mainframes utilizados solo por grandes corporaciones, a la revolución de computadoras personales llegando al usuario común, hasta dispositivos portátiles inteligentes, el más común los celulares (móviles). Tecnologías como J2ME o Google Android (para móviles) podrían permitir varios dispositivos inteligentes por persona, y si imaginamos que entre ellos se pueden comunicar y compartir funcionalidad, podemos imaginar todo un entorno de trabajo inteligente.
2. IPv6: este tecnología no está relacionada directamente con el desarrollo de la Web ubicua, sin embargo me resulta interesante que los planes de implementación de IPv6 son a corto plazo, y que ofrecerán miles de IPs por metro cuadrado en la Tierra. Se podría pensar en una cantidad por demás exagerada a las necesidades actuales, pero resulta curiosamente muy útil para el punto #1 :-) .
3. Semántica: muchos utilizan el término de Web Semántica para definir a la Web 3.0, pero en mi opinión la semántica es solo una herramienta que permitirá la ubicuidad. ¿Qué es la semántica? Pues podemos recordar que en nuestro idioma tenemos un vocabulario que nos provee del conjunto de palabras que podemos utilizar; la sintáctica nos define cómo unir los elementos del vocabulario en oraciones y conceptos; y la semántica nos permite entender o comprender las oraciones. ¿Qué busca la semántica en la Web? Pues ahora que tenemos estándares que nos permiten formar oraciones y que las máquinas se puedan comunicar (XML), se necesita desarrollar estándares que permitan a las máquinas comprender esos datos para poder relacionarlos y comprenderlos. En otras palabras, si una máquina comprende cierta información, se busca que a partir de ellos y de otros datos espaciales y/o temporales pueda inferir información adicional que sea realmente útil. Estos estándares existen en la actualidad aunque no son tan conocidos, pero el mismo Berners-Lee es parte del grupo investigador. Resource Description Framework o RDF permite modelar datos y definir meta-data que relaciona “objetos” (o conceptos); y Web Ontology Language o OWL que es un lenguaje que utiliza RDF para definir ontologías que permitan representar conceptos y sus relaciones en un dominio.
4. Aplicaciones en línea: y no hablo de las aplicaciones Web actuales, sino de aplicaciones mucho más potentes que son almacenadas y ejecutadas en línea, permitiendo que las aplicaciones que usamos a diario estén en Internet y no en nuestras terminales. Ya existen aplicaciones de este tipo en la actualidad, pero resultan interesantes algunas propuestas como el Google App Engine, que empiezan a ofrecer este tipo de servicio.

Con estos 3 términos las opciones, en mi opinión, son infinitas. Podemos imaginar un ejemplo sencillo, sin caer en la fantasía, en una aplicación para nuestro móvil que nos transmita información importante acerca de la calle donde nos encontramos, y que se comunique con nuestra tienda de preferencia para hacer un pedido que se relacione con ello. Es todo un cambio de paradigma donde pasamos de una red “tonta” con terminales inteligentes, a una red inteligente con terminales inteligentes que está consciente de nuestro entorno y trabaja para nosotros.

La Web Ubicua es un concepto que está aún en desarrollo, pero llama curiosamente la atención como se van complementando algunas tecnologías que nos permiten imaginar (o soñar?) lo que podemos esperar en un futuro no muy lejano. Sin embargo, igual me gustaría que todo esto que menciono sea solo una pequeña parte de lo que está por venir, y que aún falten muchísimas cosas por explorar y descubrir.