PDA

View Full Version : [MySql] Aiutatemi a trovare una strategia per popolare un database con molti dati


D4rkAng3l
19-05-2009, 12:12
Ciao,
sono un po' disperato: devo fare un esame di laboratorio di database, devo prendere il progetto del vecchio corso (una semplicistica versione del db di sistema d aste online, popolarlo con tantissimi dati e poi ottimizzare le tabelle con indici ed ottimizzazione mediante le view e far vedere la differenza di risposta delle query nel db ottimizzato rispetto alla versione non ottimizzata dello stesso.

Per ottenere tali risultati devo popolare a dismisura il databse con tantissimi dati...a mano è impensabile inserire qualcosa come 5000 utenti, relative inserzioni e così via.

Io ho pensato così: parto dalla prima tabella da cui avevo iniziato gli inserimenti (tabella che non è referenziata da altre tabelle ma che non referenzia nessuno) e vado avanti gerarchicamente con scrivendo qualche scriptino che preleva i dati man mano dalle tabelle create e mi genera nuovi record (anche se non sò esattamente come fare e vi chiedo una mano almeno ad aiutarmi ad impostare)

Vi mostro la struttura delle prime 2 tabelle da popolare:


create table CITTA
(
Cap tinyint not null references UTENTE(Cap),
Citta varchar(35) not null,
primary key (Cap, Citta)
) type=InnoDB;

create table UTENTE
(
User_Id varchar(20) not null primary key,
Nome varchar(20) not null,
Cognome varchar(20) not null,
Data_Nascita date not null,
Indirizzo varchar(50) not null,
Cap int not null
) type=InnoDB;


E già quì mi pare di notare un errore fatto l'anno scorso (quando feci il progetto): cioè io ho queste 2 tabelle:
1) CITTA che contiene il nome della città ed il relativo codice CAP
2) UTENTE che contiene i vari dati anagrafici di ogni utente

Io nella tabella CITTA misi questa riga:
Cap tinyint not null references UTENTE(Cap) relativa al codice CAP ma ora mi sorge il dubbio che sia sbagliata in quanto ogni città a un preciso CAP e casomai è il campo CAP di UTENTE che dovrebbe referenziare il campo Cap della tabella CITTA....o sbaglio? (potrei anche sbagliarmi visto che è più di un anno che non metto mano a SQL e la sintassi ce l'ho un po' arruginita)

Comunque vabbè...se è sbagliato faccio un alter table e passa la paura....

Comunque la mia idea sarebbe questa:
1) Popolo la tabella CITTA con la lista delle associazioni (CITTA' ITALIANE) -(RELATIVO CAP)

2) Scrivo uno scriptino in qualcosa (anche C o Java) che mi realizza un file di testo contenente gli insert nella forma:
un nome progressivo per il campo username (tipo USER1, USER2, USER3,...)
un nome ed un cognome progressivi per i campi nome e cognome (NOME1, NOME2, NOME3,.... COGNOME1, COGNOME2, COGNOME3)
una data di nascita casuale per il campo data
una stringa casuale per l'indirizzo (tanto non mi serve che sia il nome di una via reale basta anche qualcosa tipo "fhoisdfhosihfsoidfhsdo")
A questo punto per il cap si fà più difficile perchè devo mantenere il vincolo di integrità referenziale (si chiamava così? boo) e gli devo far estrarre dalla tabella CITTA il codice Cap di una qualsiasi (casualmente=) città realmente presente nella tabella CITTA), lo estreae e lo inserisce.

A questo punto quando poi vado a fare gli insert non dovrebbe creare problemi di matching e dovrebbe inserirmi i dati correttamente....dite che è una strategia percorribile?

Cosa mi consigliate di usare? Io pensavo a Java in quanto in Java mi pare molto semplice manipolare le stringhe anche se boo non sono molto esperto.
Avevo sentito un amico (che deve fare lo stesso progetto ma credo stia in alto mare anche lui) che pensava di usare le stored procedure (che dovrò studiare per sto corso ma che ancora non conosco affatto).

Vi prego di darmi una manina (le tabelle sono parecchie: tipo 12 e se non inizio subito e non trovo ora una strategia non finirò mai in tempo)

Grazie
Andrea

qwerty86
19-05-2009, 12:55
se ho ben capito ti serve qualcosa per popolare quelle tabelle automaticamente?

http://sqlmanager.net/en/products/mysql/datagenerator

D4rkAng3l
19-05-2009, 14:44
se ho ben capito ti serve qualcosa per popolare quelle tabelle automaticamente?

http://sqlmanager.net/en/products/mysql/datagenerator

mmm interessante...ora gli dò un'occhiata.

Avevo gia provato ad usare spawner data generator che però è molto molto rozzo e praticamente non gestisce i vincoli di integrità referenziale...quindi una volta che avevo popolato una delle due tabelle...l'altra non matchava i dati...

Comunque sai dirmi qualcosa circa quel presunto erore che ho trovato nel mio progetto (quello del vincoli di integrità referenziale capovolto)


Grazie
Andrea

gugoXX
19-05-2009, 15:11
mmm interessante...ora gli dò un'occhiata.

Avevo gia provato ad usare spawner data generator che però è molto molto rozzo e praticamente non gestisce i vincoli di integrità referenziale...quindi una volta che avevo popolato una delle due tabelle...l'altra non matchava i dati...

Comunque sai dirmi qualcosa circa quel presunto erore che ho trovato nel mio progetto (quello del vincoli di integrità referenziale capovolto)


Grazie
Andrea

Quel vincolo di integrita' e' sbagliato.
E' l'utente ad abitare in una citta', e non il viceversa
Quindi sarebbe corretto avere CAP come chiave primaria della tabella Citta', referenziata dalla tabella utente.

Poi il fatto che in ITalia ogni CAP puo' essere associato a piu' citta' e' solo indice del fatto che CAP non puo' essere eletto a chiave primaria delle citta'.

Da cosa si identifica una citta' italiana?
Non c'e' alcuna direttiva ufficiale.
A questo punto inserisci tu una chiave univoca privata (Il classico ID eventualmente autoincrementante) ed usa quella tutto dove occorre indicare una citta'.

Per il popolamento, prima inserirai tutte le citta'.
e poi tirerai a caso tutti gli utenti.