D4rkAng3l
19-05-2009, 12:12
Ciao,
sono un po' disperato: devo fare un esame di laboratorio di database, devo prendere il progetto del vecchio corso (una semplicistica versione del db di sistema d aste online, popolarlo con tantissimi dati e poi ottimizzare le tabelle con indici ed ottimizzazione mediante le view e far vedere la differenza di risposta delle query nel db ottimizzato rispetto alla versione non ottimizzata dello stesso.
Per ottenere tali risultati devo popolare a dismisura il databse con tantissimi dati...a mano è impensabile inserire qualcosa come 5000 utenti, relative inserzioni e così via.
Io ho pensato così: parto dalla prima tabella da cui avevo iniziato gli inserimenti (tabella che non è referenziata da altre tabelle ma che non referenzia nessuno) e vado avanti gerarchicamente con scrivendo qualche scriptino che preleva i dati man mano dalle tabelle create e mi genera nuovi record (anche se non sò esattamente come fare e vi chiedo una mano almeno ad aiutarmi ad impostare)
Vi mostro la struttura delle prime 2 tabelle da popolare:
create table CITTA
(
Cap tinyint not null references UTENTE(Cap),
Citta varchar(35) not null,
primary key (Cap, Citta)
) type=InnoDB;
create table UTENTE
(
User_Id varchar(20) not null primary key,
Nome varchar(20) not null,
Cognome varchar(20) not null,
Data_Nascita date not null,
Indirizzo varchar(50) not null,
Cap int not null
) type=InnoDB;
E già quì mi pare di notare un errore fatto l'anno scorso (quando feci il progetto): cioè io ho queste 2 tabelle:
1) CITTA che contiene il nome della città ed il relativo codice CAP
2) UTENTE che contiene i vari dati anagrafici di ogni utente
Io nella tabella CITTA misi questa riga:
Cap tinyint not null references UTENTE(Cap) relativa al codice CAP ma ora mi sorge il dubbio che sia sbagliata in quanto ogni città a un preciso CAP e casomai è il campo CAP di UTENTE che dovrebbe referenziare il campo Cap della tabella CITTA....o sbaglio? (potrei anche sbagliarmi visto che è più di un anno che non metto mano a SQL e la sintassi ce l'ho un po' arruginita)
Comunque vabbè...se è sbagliato faccio un alter table e passa la paura....
Comunque la mia idea sarebbe questa:
1) Popolo la tabella CITTA con la lista delle associazioni (CITTA' ITALIANE) -(RELATIVO CAP)
2) Scrivo uno scriptino in qualcosa (anche C o Java) che mi realizza un file di testo contenente gli insert nella forma:
un nome progressivo per il campo username (tipo USER1, USER2, USER3,...)
un nome ed un cognome progressivi per i campi nome e cognome (NOME1, NOME2, NOME3,.... COGNOME1, COGNOME2, COGNOME3)
una data di nascita casuale per il campo data
una stringa casuale per l'indirizzo (tanto non mi serve che sia il nome di una via reale basta anche qualcosa tipo "fhoisdfhosihfsoidfhsdo")
A questo punto per il cap si fà più difficile perchè devo mantenere il vincolo di integrità referenziale (si chiamava così? boo) e gli devo far estrarre dalla tabella CITTA il codice Cap di una qualsiasi (casualmente=) città realmente presente nella tabella CITTA), lo estreae e lo inserisce.
A questo punto quando poi vado a fare gli insert non dovrebbe creare problemi di matching e dovrebbe inserirmi i dati correttamente....dite che è una strategia percorribile?
Cosa mi consigliate di usare? Io pensavo a Java in quanto in Java mi pare molto semplice manipolare le stringhe anche se boo non sono molto esperto.
Avevo sentito un amico (che deve fare lo stesso progetto ma credo stia in alto mare anche lui) che pensava di usare le stored procedure (che dovrò studiare per sto corso ma che ancora non conosco affatto).
Vi prego di darmi una manina (le tabelle sono parecchie: tipo 12 e se non inizio subito e non trovo ora una strategia non finirò mai in tempo)
Grazie
Andrea
sono un po' disperato: devo fare un esame di laboratorio di database, devo prendere il progetto del vecchio corso (una semplicistica versione del db di sistema d aste online, popolarlo con tantissimi dati e poi ottimizzare le tabelle con indici ed ottimizzazione mediante le view e far vedere la differenza di risposta delle query nel db ottimizzato rispetto alla versione non ottimizzata dello stesso.
Per ottenere tali risultati devo popolare a dismisura il databse con tantissimi dati...a mano è impensabile inserire qualcosa come 5000 utenti, relative inserzioni e così via.
Io ho pensato così: parto dalla prima tabella da cui avevo iniziato gli inserimenti (tabella che non è referenziata da altre tabelle ma che non referenzia nessuno) e vado avanti gerarchicamente con scrivendo qualche scriptino che preleva i dati man mano dalle tabelle create e mi genera nuovi record (anche se non sò esattamente come fare e vi chiedo una mano almeno ad aiutarmi ad impostare)
Vi mostro la struttura delle prime 2 tabelle da popolare:
create table CITTA
(
Cap tinyint not null references UTENTE(Cap),
Citta varchar(35) not null,
primary key (Cap, Citta)
) type=InnoDB;
create table UTENTE
(
User_Id varchar(20) not null primary key,
Nome varchar(20) not null,
Cognome varchar(20) not null,
Data_Nascita date not null,
Indirizzo varchar(50) not null,
Cap int not null
) type=InnoDB;
E già quì mi pare di notare un errore fatto l'anno scorso (quando feci il progetto): cioè io ho queste 2 tabelle:
1) CITTA che contiene il nome della città ed il relativo codice CAP
2) UTENTE che contiene i vari dati anagrafici di ogni utente
Io nella tabella CITTA misi questa riga:
Cap tinyint not null references UTENTE(Cap) relativa al codice CAP ma ora mi sorge il dubbio che sia sbagliata in quanto ogni città a un preciso CAP e casomai è il campo CAP di UTENTE che dovrebbe referenziare il campo Cap della tabella CITTA....o sbaglio? (potrei anche sbagliarmi visto che è più di un anno che non metto mano a SQL e la sintassi ce l'ho un po' arruginita)
Comunque vabbè...se è sbagliato faccio un alter table e passa la paura....
Comunque la mia idea sarebbe questa:
1) Popolo la tabella CITTA con la lista delle associazioni (CITTA' ITALIANE) -(RELATIVO CAP)
2) Scrivo uno scriptino in qualcosa (anche C o Java) che mi realizza un file di testo contenente gli insert nella forma:
un nome progressivo per il campo username (tipo USER1, USER2, USER3,...)
un nome ed un cognome progressivi per i campi nome e cognome (NOME1, NOME2, NOME3,.... COGNOME1, COGNOME2, COGNOME3)
una data di nascita casuale per il campo data
una stringa casuale per l'indirizzo (tanto non mi serve che sia il nome di una via reale basta anche qualcosa tipo "fhoisdfhosihfsoidfhsdo")
A questo punto per il cap si fà più difficile perchè devo mantenere il vincolo di integrità referenziale (si chiamava così? boo) e gli devo far estrarre dalla tabella CITTA il codice Cap di una qualsiasi (casualmente=) città realmente presente nella tabella CITTA), lo estreae e lo inserisce.
A questo punto quando poi vado a fare gli insert non dovrebbe creare problemi di matching e dovrebbe inserirmi i dati correttamente....dite che è una strategia percorribile?
Cosa mi consigliate di usare? Io pensavo a Java in quanto in Java mi pare molto semplice manipolare le stringhe anche se boo non sono molto esperto.
Avevo sentito un amico (che deve fare lo stesso progetto ma credo stia in alto mare anche lui) che pensava di usare le stored procedure (che dovrò studiare per sto corso ma che ancora non conosco affatto).
Vi prego di darmi una manina (le tabelle sono parecchie: tipo 12 e se non inizio subito e non trovo ora una strategia non finirò mai in tempo)
Grazie
Andrea