PDA

View Full Version : [Python 2.7] Sommare righe consecutive con valori uguali


Xfree
08-01-2013, 15:39
Ciao a tutti ho un dubbio che, per quanto banale, non riesco a risolvere da solo.
Supponiamo che io abbia in memoria una lista del tipo


A 3
A 4
A 5
B 3
B 8
B 9


Vorrei sommare i valori della seconda colonna, quando i valori della prima sono uguali.


A 12
B 20


C'è un modo efficiente per farlo in python e che io sconosco, o risolvo facendo un doppio ciclo? Diciamo una cosa equivalente al group by.
Grazie in anticipo.

cdimauro
08-01-2013, 16:20
C'è un modo molto efficiente (usando una sola, breve, riga di codice) tramite la funzione built-in sum. Ma prima dovresti farmi un esempio concreto di com'è fatta la tua lista, perché dagli esempi non è chiaro.

GByTe87
08-01-2013, 16:24
Prima cosa che mi è venuta in mente, supponendo che la lista sia una lista di tuple:


a = [('a',1), ('b', 2), ('a', 3)]
x = {}
for (k,v) in a:
if k not in x: x[k] = 0
x[k] += v

C'è un modo molto efficiente (usando una sola, breve, riga di codice) tramite la funzione built-in sum. Ma prima dovresti farmi un esempio concreto di com'è fatta la tua lista, perché dagli esempi non è chiaro.

Lo sospettavo. :mc:

Xfree
08-01-2013, 16:36
Pensavo fosse chiaro. :D :muro: :cry:
Ho dei nomi e delle spese


BIANCHI 5
BIANCHI 10
BIANCHI 15
ROSSI 7
ROSSI 8
VERDI 4
VERDI 6


Quindi devo sommare tutte le spese di ogni persona affinché risulti


BIANCHI 30
ROSSI 15
VERDI 10

GByTe87
08-01-2013, 16:38
Quello che chiedeva cdimauro è: com'è strutturata la lista? lista di tuple? lista di oggetti custom?

cdimauro
08-01-2013, 16:43
Sì, esatto. Comunque riflettendoci forse non si può usare la funzione sum (prima avevo letto male il problema).

Comunque c'è sicuramente una forma abbastanza semplice e compatta per ottenere quel risultato.

Xfree
08-01-2013, 16:43
Pardon, sono rinco.
E' una lista di tuple ma potrei trasformarla in qualunque altro tipo più adatto perché leggo le informazioni da un file Excel che in python è un oggetto custom.

cdimauro
08-01-2013, 17:21
Prima cosa che mi è venuta in mente, supponendo che la lista sia una lista di tuple:


a = [('a',1), ('b', 2), ('a', 3)]
x = {}
for (k,v) in a:
if k not in x: x[k] = 0
x[k] += v

Lo sospettavo. :mc:
E invece no. :D Avendo una lista di tuple, la soluzione più efficiente è la tua.

Avevo pensato inizialmente alla classe Counter, ma non funziona con le liste (o tuple) complesse, come in questo caso, perché richiede che siano "flat".

Tirare fuori soluzioni "one-liner" non mi sembra il caso. Il tuo codice è già abbastanza pulito di suo. Al limite una piccola sistemata:

a = [('a',1), ('b', 2), ('a', 3)]
x = {}
Get = x.get
for k, v in a:
x[k] = Get(k, 0) + v
Ma niente di eccezionale, come vedi.

Xfree
08-01-2013, 18:45
Grazie come al solito. :)
C'è sempre da imparare.

GByTe87
08-01-2013, 19:05
E invece no. :D Avendo una lista di tuple, la soluzione più efficiente è la tua.

Ottimo! :D

Avevo pensato inizialmente alla classe Counter, ma non funziona con le liste (o tuple) complesse, come in questo caso, perché richiede che siano "flat".

Posta posta, son curioso. :D

cdimauro
08-01-2013, 21:27
La classe Counter del modulo collections è uno speciale dizionario che consente di contare le occorrenze delle chiavi.

C'è un suo metodo, update, che consente di aggiornare chiavi e conteggi. Se gli viene passato un dizionario, nel caso di chiavi presenti sia nel counter che nel dizionario passato, i valori associati a quella chiave verranno sommati. Se, invece, la chiave è presente soltanto nel dizionario passato, allora verrà copiata nel counter.

Il metodo update consente di passare anche una sequenza (o iteratore) come argomento, ed era su questo che contavo quando ho scritto in precedenza. Pensavo che funzionasse in maniera simile al dizionario, con elementi costituiti da coppie (tuple con chiave e valore), oppure con chiavi e valori intervallati sequenzialmente. Invece si tratta di una semplice sequenza, in cui tutti i valori vengono presi singolarmente come fossero delle chiavi, e dunque conteggiati per uno, per cui ci sono rimasto fregato. :stordita: