I OpenDatathon ETSINF UPV sobre uso de datos abiertos

cartel

Convocatoria:

  • Los participantes tendrán tres semanas para crear un proyecto basado en datos abiertos, ya sea una visualización o una aplicación web. Los proyectos finalistas serán presentados el 4 de marzo en ETSINF UPV.

Se abre el plazo para presentar propuestas al primer OpenDatathon ETSINF –UPV organizado por MUGI, el Máster en Gestión de la Información de la ETSINF UPV-,   la’Escola Tècnica Superior d’Enginyeria Informàtica de la UPV y el Grupo DataUPVcon el fin de promocionar, promover y divulgar el uso de datos abiertos, especialmente entre los miembros de la comunidad universitaria.

La iniciativa cuenta con el apoyo de la Conselleria de Transparència, Responsabilitat Social, Participació i Cooperació de la Generalitat Valenciana,Fundación Inndea, Cátedra Ciudad de Valencia de la UPV y las empresas BigMLy everis. El plazo de presentación de proyectos estará abierto hasta el próximo 29 de febrero de 2016.

El I OpenDatathon cuenta con 3 categorías: mejor historia sobre los datos, mejor herramienta de exploración de datos y mejor aplicación basada en predicción de datos. También habrá una categoría especial “Premio Cátedra Ciudad de Valencia UPV” con retos que usen datos abiertos del portal del ayuntamiento de Valencia sobre rutas, salud o movilidad.

En este enlace puedes consultar el detalle de las bases para participar

Esta competición, centrada en el uso de datos abiertos, se dirige especialmente a estudiantes de la Comunidad Valenciana matriculados en el curso 2015-2016, aunque cualquier persona interesada puede participar también en la categoría 3: “Mejor aplicación basada en predicción de datos”. Cada proyecto puede formar parte de más de una categoría y quedarán excluidas aquellas propuestas que hayan sido premiadas previamente.

La organización ha preparado un listado de recursos, fuentes de datos, herramientas y ejemplos que faciliten la participación de los estudiantes en la competición.

Todos los proyectos finalistas recibirán un diploma acreditativo. Adicionalmente por cada reto se prevé un primer premio de 350 euros y un segundo premio de 150 euros.

Una vez recibidas las propuestas se seleccionarán 5 finalistas por categoría que tendrán la oportunidad de exponer sus trabajos el 4 de marzo en la ETSINF, fecha próxima a la celebración mundial del Open Data Day.

Estás en: Home » Noticias » Seminario abierto de MUIINF: Plataforma VLCi, Valencia Smart City con Inndea Seminario abierto de MUIINF: Plataforma VLCi, Valencia Smart City con Inndea

2015-10-20_1031

El próximo jueves, 5 de noviembre, el profesor Pietro Manzoni ha organizado una charla de InnDEA con el título “Plataforma VLCi, Valencia Smart City” en el marco de una jornada en la que se presentarán varios proyectos vinculados a la Estrategia Valencia Ciudad Inteligente.

La sesión se celebrará de 12:30 a 14:30, en el Salón de Actos de la Escola Tècnica Superior d’Enginyeria Informàtica (ETSINF). El objetivo de este seminario es conocer las actividades que se están llevando a cabo en Valencia en el marco de la Estrategia Valencia Ciudad Inteligente y que están relacionadas con temáticas como la “Plataforma integral de gestión de ciudad / Fi Ware“, el “Portal de transparencia y datos ” y la “AppValencia” como ejemplos más representativos.

Las ciudades son complejos sistemas dinámicos que generan grandes cantidades de datos, su uso inteligente de la mano de las tecnologías de la información y comunicación puede facilitar hacer frente a los retos presentes y futuros.

La Fundación InnDEA Valencia es una entidad promovida por el Ayuntamiento de Valencia con el objeto de apoyar e incentivar en la ciudad el desarrollo mediante la innovación en sus diversas vertientes. Inndea está abierta a propuestas para desarrollar proyectos de investigación por lo que la Jornada es una buena oportunidad para que alumnado y profesorado pueda conocer su actividad y proponer iniciativas.

Esta presentación se enmarca en el ciclo de Seminarios de la asignatura de “Redes y Seguridad” del Máster en Ingeniería Informática de la ETSINF MUIINF (http://muiinf.webs.upv.es/) y está relacionada con las actividades de la Cátedra Ciudad de Valencia UPV.

5 Razones para elegir el Máster o el D.E. en Big Data de la UPV

5 Razones para elegir el Máster o el D.E. en Big Data de la UPV

  1. La creciente demanda de profesionales expertos en gestión, almacenamiento, procesamiento, depuración, visualización y análisis de grandes volúmenes de datos garantiza un puesto de trabajo cualificado y bien remunerado a corto y medio plazo.
  2. No dejes pasar la oportunidad de especializarte en un área de conocimiento tan nueva y demandada como es Big Data.
  3. En #BigDataUPV cuentas con la visión de profesionales de las empresas participantes que impartirán asignaturas y “máster classes” monográficas sobre temas relevantes de Big Data.
  4. Todo a ello a un precio muy ajustado. 2500€ para miembros UPV, miembros AlumniUPV y desempleados, y 3000€ para el público en general.
  5. Además existe la posibilidad de realizar prácticas remuneradas en algunas de las empresas participantes.

Competición predicción de uso de Valenbisi en ECML/PKDD 2015

Relacionado con el  proyecto de investigación  Reframe, el grupo DMIP del DSIC coorganiza una competición de Ciencia de Datos basado en el uso de bicicletas de Valenbisi: .

La competición se organiza dentro de la Conferencia  “ECML PKDD – European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases 2015″ una de las más prestigiosas en el campo de aprendizaje automático y descubrimiento de conocimiento.

http://www.ecmlpkdd2015.org/
El objetivo de esta competición consiste en predecir el número  de bicicletas disponibles con tres horas de anticipación para un conjunto determinado de estaciones y un periodo de test, a partir del histórico de uso de esas estaciones y de otras estaciones de la red de Valenbisi.

Actualmente existen tres becas para los participantes que consigan  mejores modelos que otorgan la inscripción a la conferencia.

Información  completa sobre la competición en este enlace.

http://reframe-d2k.org/Challenge

Las 25 habilidades más solicitadas en 2014 según LinkedIn

La red social LinkedIn ha elaborado un estudio sobre los conocimientos y habilidades más solicitados de acuerdo a los puestos de empleo ofertados en su red.

El informe destaca cuatro puntos:

  • Invierte en STEM: science, technology, engineering, and math.
  • Vivimos en un mundo controlado por los datos. Los empleos que exploran, transforman y analizan datos no detienen su crecimiento.
  • Es importante conocer varios idiomas
  • La figura del Chief marketing officer está tomando cada vez más relevancia

En cualquier caso la presencia de la informática es abrumadora. De las 25 habilidades sólo 4 no tienen relación directa con la ingeniería informática.

Informe completo.

El ‘big data’ llega al fútbol

Cada vez son más lo que perciben en Estados Unidos el fútbol casi como si fuera una práctica empírica, alejada de la apasionada variabilidad. Tras hacerse un hueco en el mundo de las empresas, la política y los principales deportes estadounidenses, el creciente interés por el big data ha llegado al soccer y puede revolucionar a nivel mundial el modo de tomar decisiones de los entrenadores.

Noticia en El Páis.

Más enlaces

http://fivethirtyeight.com/features/lionel-messi-is-impossible/

http://ejoh.se/worldcup2014/

http://fivethirtyeight.com/datalab/the-most-likely-scores-in-the-world-cup-final/

Deepface:nuevo algoritmo de Facebook para etiquetar automáticamente los rostros en fotografías

facebook facial recognition

Facebook posee la biblioteca de fotos más grande del mundo, y ahora tiene la tecnología para que identifique la mayoría de las caras de estas fotos, incluso los que no se etiquetan. Facebook anunció la semana pasada que ha desarrollado un programa llamado “Deepface” que puede determinar si dos caras fotografiadas son de la misma persona con el 97,25 por ciento de exactitud.

Noticia completa: http://www.huffingtonpost.com/2014/03/18/facebook-deepface-facial-recognition_n_4985925.html

Artículo sobre el sistema: https://www.facebook.com/publications/546316888800776/

Clasificación de tweets, utilizando Aprendizaje automático

Para tener una idea general del contexto en el cual se desarrollo este trabajo, dedicaremos estas lineas para tratar de explicar a grandes rasgos las áreas de estudio y las tecnologías que se aplicaron.

Agentes inteligentes, lógica difusa, minería de datos, son algunos de los campos de estudio de la Inteligencia Artificial. En este documento se hará inca-pie en minería de datos, ya que esta nos permite contar con herramientas útiles para nuestro estudio.

Minería de datos, hace uso de algoritmos de aprendizaje automático (machine learning) para resolver problemas de clasificación. En este contexto entendemos machine learning como “el hecho de ensenar a un maquina para que pueda llevar tareas por si misma”

Cuando se aborda un problema de clasificación, hay que tomar en cuenta que se presentan dos formas de hacer esta tarea: La clasificación supervisado y la no supervisado. En nuestro caso, decidimos utilizar la primera debido a las condiciones del problema, ya que el mismo cuenta con un dataset “etiquetado correctamente” para todas las categorías.

Ya teniendo una idea general del marco de acción, podemos mencionar: que el objetivo de este trabajo, es la aplicación de machine learning para la clasificación de tweets.

Para alcanzar este objetivo, se desarrollaron diferentes tareas que nos permitieron poco a poco resolver problemas particulares(que se explicara mas adelante)para poder concluir en el objetivo planteado.

En este estudio se define un atributo clase, la cual llegar a ser la categoría a la cual pertenece el tweet. Las categorias consideradas son las siguientes: tweetsArte, tweetsBebidas, tweetsCine, tweetsDeportes, tweetsEconomia, tweetsEducacion, etc.. Por tanto, cualquier tweet que sea clafisicado tendra que pertenecer a cualquiera de estas categorías.

El siguiente diagrama, sirvió como una metodología orientativa, ya que al cumplir con cada actividades planteada en ella, se logra obtener buenos resultados.

supervised-classification

Para la extracción de características se utilizo PLN, para así poder contar con documentos que cumpliesen con los siguientes aspectos: lematización, eliminación de palabras vacías, etc.

El algoritmo que se decidió utilizar fue naive bayes, debido a que cumple con los requerimientos planteados en el problema. Posteriormente a la creación del modelo, se puedo realizar la siguiente prueba.

Datos de entrada para probar el sistema:

 img1

Resultados:

img2

A manera de conclusión, podemos mencionar que: aplicar aprendizaje automático a diferentes áreas sociales (en este caso, clasificación de tweets) puede traer muchos beneficios, entre ellos la automatización de procesos tediosos, gestión (procesamiento) de muchos datos de manera casi instantánea, etc.

Son muchas la aplicaciones que se pueden dar a este tipo de trabajo. En este caso: Utilizamos datos de un red social, pero este proceso de automatización de clasificación, se puede dar con casi cualquier documento digital.

Con relación a los resultados obtenidos: Es evidente que existe existen tweets que no lograron ser clasificados en su categoría correspondiente. Para solucionar este problema, es indispensable contar con un dataset muy bien elaborado. El mismo que, en lo posible limite de manera explicita el dominio de palabra utilizadas por cada categoría.

Autor: Victor Nina A.

Contacto:   vicnial(at)inf(dot)upv(dot)es