PDA

View Full Version : [JAVA]Parsing di una stringa


neosephiroth86
21-03-2010, 19:57
Ciao a tutti ragazzi.
Il problema è questo ho una stringa immessa in input del tipo
(NUMERO OPERANDO NUMERO) OPERANDO (NUMERO OPERANDO NUMERO).......non definito bene la lunghezza
in cui numero è un intero e operando le 4 operazioni + - * /
Devo sostanzialmente compiere un parsing sulla stringa e salvare ogni token in una posizione di un vettore. quindi ad esempio (3 + 5) * (6 -2)- (5 %5)
è accettata,compresi gli spazi non sempre definiti precisamente, e alla posizione 0 del vettore ,quindi,avrò 3. Alla posizione uno + alla posizione 3 * e così via...Come posso fare? Ho provato a scaricare JavaCC ma è un casino non mi ci ritrovo per niente...mi potreste dare una mano?
Grazie

Gelert
21-03-2010, 20:36
puoi usare il metodo dello stack, in base alla cosa che incontri decidi se inserire nello stack o prelevare.

neosephiroth86
21-03-2010, 20:38
ti ringrazio ma per metodo dello stack cosa intendi?un metodo di JavaCC ? potresti essere un pò + chiaro per favore? sono nuovo di java....

Gelert
21-03-2010, 20:45
presupponendo che sai cos'è uno stack ti implementi un oggetto che lo realizza (non sono sicuro ma mi sembra che c'è già una versione nella libreria di Java).

in base al tipo di stringhe che vuoi accettare decidi cosa fare

esempio: se le stringhe accettate devono avere esplicitate tutte le parentesi e una parentesi può contenere solo un operatore (considerando il risultato delle parentesi innestate come operando) le operazione sono le seguenti

trovo parentesi aperta niente
trovo un numero push del numero
trovo un operatore push dell'operatore
trovo una parentesi chiusa primo pop da salvare come secondo operando, secondo pop da salvare come operatore e terzo pop per il primo operando

Gold
22-03-2010, 00:54
Non so se ho capito bene, ma dal tuo esempio dovresti tirar fuori una cosa del genere {3, +, 5, *, 6, -, 2, -, 5, %, 5} ??

Se e' cosi basta scorrere la stringa, se il carattere e' contenuto nel set di riferimento, lo aggiungi al vettore di output.

Saluto

neosephiroth86
22-03-2010, 06:34
si esattamente gold questo devo fare...che metodo posso usare per vedere se + contenuto?scusami ma sono alle prime armi....

Gold
22-03-2010, 08:59
puoi creare un hashset con gli elementi ammissibili e testare se sono presenti con il metodo contains()

Saluto

neosephiroth86
22-03-2010, 10:36
stò provando ad implementare questo metodo ma ho difficoltà a completarlo nel ciclo for...


private Vector parser(String string){
int lunghezza=string.length();
string.replace(" ", "");//si rimuovono tutti gli spazi vuoti
string.replace("(", "");
string.replace(")", "");
int k;
for (k=0;k<lunghezza;k++) {
\\quando trovo un insieme di numeri concocatenati chessò 4567 vector.addElement("4567");
\\quando trovo + - * / vector.addElement(l'operando));


}
}

Gelert
22-03-2010, 10:36
a dire il vero nel mio esempio puoi operare ogni volta che trovi la chiusa per fare fare quello che vuoi

per esempio se lo scopo è ottenere il risultato dell'espressione dopo che hai trovato la chiusa e fatto i 3 pop puoi eseguire l'operazione e fare push del risultato, in questo caso terminata l'esecuzione nello stack avrai solo il valore risultato dell'espressione.

poi se lo scopo è salvare tutti i token nell'ordine grafico in cui appaiono basta scorrere la stringa (a dire il vero lo scopo non si capisce molto da come è descritto)

Gelert
22-03-2010, 11:06
stò provando ad implementare questo metodo ma ho difficoltà a completarlo nel ciclo for...


private Vector parser(String s){
int lunghezza=string.length();
string.replace(" ", "");//si rimuovono tutti gli spazi vuoti
string.replace("(", "");
string.replace(")", "");
int k;
for (k=0;k<lunghezza;k++) {
\\quando trovo un insieme di numeri concocatenati chessò 4567 vector.addElement("4567");
\\quando trovo + - * / vector.addElement(l'operando));


}
}

a parte che ti conviene dichiare il k all'interno del for così lo elimina una volta terminato il for


for (int k = 0, k < lunghezza, k++){


se lo scopo è solo salvare i token (come deduco dal tuo codice) fai così:


private Vector parser(String s){
Vector v = new Vector ();
s = s.replaceAll(" ", "");
s = s.replaceAll("(", "");
s = s.replaceAll(")", "");
//si rimuovono tutti gli spazi vuoti e le parentesi

StringTokenizer st = new StringTokenizer (s, "+-*/", true);
while (st.hasMoreTokens()){
v.add(st.nextToken());
}
v.trimToSize;
return v;
}

P.S.

StringTokenizer riceva una stringa e la suddivide in token, ha tre costruttori:
solo la stringa (assume che il separatore è lo spazio)
due stringhe (la prima è la stringa da tokenizzare la seconda contiene la lista di tutti i separatori)
due stringhe un boolean (vedi sopra per le stringhe, il boolean inserisce tra i token anche i separatori con un token a loro dedicato, se false li elimina, i costruttori senza boolean considera come se fosse false)

per usare StringTokenizer devi importare
import java.util.StringTokenizer;

WarDuck
22-03-2010, 11:07
Se devi compiere il parsing e quindi analizzare la struttura sintattica di ciò che passi, ad esempio:

ACCETTO "( 4 + 3 )"
NON ACCETTO "( 4 + 3" poiché manca la parentesi finale

Allora come dice Gelert devi usare uno stack (implementabile tramite LinkedList, che mette a disposizione i metodi push e pop).

Se devi semplicemente raccogliere i token allora basta una scansione con il for.

Puoi usare un HashSet<Character> affinché i token non vengano duplicati.

Se vuoi usare un semplice array allora ti conviene usare la classe ArrayList<Character> anziché un Vector (consigliabile solo se accedi al vettore da più thread).

PS: String è una classe immutabile quindi string.replace() dovrebbe restituire una nuova stringa, SENZA CAMBIARE LA CORRENTE.

neosephiroth86
22-03-2010, 11:22
gelert scusami ma il codice che mi hai mandato non sembra funzionare mi dà errore invalid character constant alla prima variabile

x warduck grazie dell'aiuto infatti poi dovrei eseguire operazioni multithreaded sui vari token,
in teoria io ho chessò (15x5)+(3x2)+(6/3)+(5+2)
devo prima attivare 3 thread in esecuzione contemporanea uno 15x5, uno 3x2, uno 6/3 ...poi devo fermarli tutti e tre e ne avvio 2 ,uno tra il risultato di di 15x5 e l'altro di 3x2...
Quindi il primo passo credo sia di immagazzinarli in un vettore in quanto l'utente inserisce il contenuto in una jTextArea,contenuto che prelevo col metodo jTextArea.getText().

Gelert
22-03-2010, 11:45
gelert scusami ma il codice che mi hai mandato non sembra funzionare mi dà errore invalid character constant alla prima variabile

il resto del codice è giusto, ho qualche problema nel trovare come eliminare parentesi e spazi, se uso replaceAll() mi da un errore a tempo di esecuzione quando va ad eliminare le parentesi, con replace() non riesco a trovare il modo per indicargli il carattere vuoto come char

Gelert
22-03-2010, 12:11
non so bene perchè ma raplaceAll si incasina se come parametri passo delle parentesi e genera un eccezione (in sostanza se chiedo di togliere una stringa e in quella stringa ci sono parentesi deve trovare una composizione unica che comprende sia l'aperta che la chiusa ma a te non va bene perché vuoi mantenere il contenuto)

perdona se il codice seguente è un po' brutale ma ho perso la fiducia nelle librerie di java :muro:


private Vector parser(String s){
Vector v = new Vector ();
String definitivo = "";
for (int i = 0; i < s.length(); i++){
char c = s.charAt(i);
if (!(c == ' ' || c == '(' || c == ')')){
definitivo = definitivo + c;
}
}
StringTokenizer st = new StringTokenizer (definitivo, "+-*/%", true);
while (st.hasMoreTokens()){
v.add(st.nextToken());
}
v.trimToSize;
return v;
}

WarDuck
22-03-2010, 12:40
La funzione ReplaceAll prende in ingresso un espressione regolare e la sostituisce con una stringa data.

Le parentesi tonde sono caratteri speciali per le espressioni regolari.

http://java.sun.com/javase/6/docs/api/java/util/regex/Pattern.html#sum

Così funziona:


String input = "(((a+b)))";

String output = input.replaceAll("[( | )]", "");

System.out.println(input); // (((a+b)))
System.out.println(output); // a+b


(stringhe immutabili -> input non viene modificata)

L'espressione regolare [( | )] è verificata se la parola contiene '(' oppure ')'.

La clausola "oppure" è realizzata con una singola barra verticale '|'.

neosephiroth86
22-03-2010, 15:48
Grazie mille adesso va bene!
senti solo v.trimToSize non mi compila,per caso devo importare qualcosa di speciale?
inoltre sembrerebbe andare bene anche senza quella istruzione...