This is an old revision of the document!
Seleccionar Datos
Deberían seleccionar algunos datos para su proyecto. Algunas consideraciones:
- El proyecto será más fácil si los datos ya están en un formato de tablas (como, p.ej., CSV, TSV, etc.)
- El esquema final debería tener al menos tres tablas y un buen diseño relacional (p.ej., estar en BCNF)
- Las consultas finales de la aplicación deberían demonstrar una mezcla de operadores de SQL, es decir, joins, consultas anidadas, agregación, etc. Los datos que ustedes elijen deben tener la “complejidad” suficiente para permitir consultas interesantes y no triviales.
- Los datos deben tener una escala razonable, es decir, al menos 10000 tuplas en total (sumando el número de tuplas de cada tabla) pero preferiblemente más.
- Por otro lado, sería una buena idea trabajar con menos de un millón de tuplas para evitar problemas de escala que pueden retrasar el proyecto.
La selección de datos es parte del proyecto, es decir que cada grupo debería encontrar sus propios datos. La siguiente lista da algunos ejemplos de fuentes de datos:
No todos los conjuntos de datos mencionados en estas fuentes son apropiados para el proyecto con respecto a las consideraciones previamente discutidas; p.ej., hay conjuntos de datos que no tienen un formato apropiado, etc. No hay que usar todos los datos disponibles en un conjunto de datos; se puede usar una muestra interesante. También se pueden seleccionar datos de otra fuente no listada aquí.
Dos grupos no pueden usar el mismo conjunto de datos, así que vamos a abrir una discusión en el foro en la cual cada grupo debería indicar su elección. No se puede seleccionar un conjunto de datos previamente indicado por otro grupo en el foro.