Si esteu treballant amb conjunts de dades més grans a Fulls de càlcul de Google, comparar valors variables pot ser un procés tediós. Per sort, la normalització és un mètode estadístic que us ajudarà a classificar valors complicats en conjunts de dades fàcils de comparar.
En aquest article s'explica què és la normalització i com es poden normalitzar les dades a Fulls de càlcul de Google per obtenir avantatges estadístics.
Com es normalitzen les dades a Fulls de càlcul de Google?
Suposem que tenim alguns valors numèrics a les cel·les que van des de A2 fins a A50. Per normalitzar aquest rang en valors entre X i Y, això és el que heu de fer:
- Si el vostre primer punt de dades és a A2, es pot trobar el primer valor normalitzat mitjançant aquesta fórmula:
(I-X) * ((A2-MIN ($ A $ 2: $ A $ 50)) / (MAX ($ A $ 2: $ A $ 50) -MIN ($ A $ 2: $ A $ 50))) + I
Utilitzeu els valors numèrics de X i Y directament.
- Un cop hàgiu introduït la fórmula del primer número, moveu el cursor del ratolí a la part inferior de la cel·la fins que es converteixi en una creu. A continuació, premeu i arrossegueu el cursor cap avall per omplir les files restants amb la fórmula. Fulls de càlcul de Google substituirà automàticament A2 pel número de fila corresponent per a les cel·les restants, mentre que tot el que hi ha darrere dels símbols $ no canviarà.
- Si voleu fer referència als valors de X i Y d'altres cel·les dels fulls, heu de posar $ s abans de la fila i la columna de les cel·les en què es troben els valors (per exemple, $ D $ 5), o copiar la fórmula pot donar-vos un error d’anàlisi o resultats incorrectes.
- Les vostres dades es normalitzaran ara entre els valors X i Y.
Normalitzar les dades és una manera excel·lent de mesurar les diferències entre dos conjunts de dades amb valors mínims i màxims diferents.
Com s'utilitza Fulls de càlcul de Google com a base de dades
Totes les bases de dades són essencialment una taula gran (o moltes taules connectades), governada per un sistema de gestió de bases de dades. Si esteu treballant amb un conjunt de dades relativament petit que no necessita escalar massa, Fulls de càlcul de Google es pot utilitzar com a base de dades.
com activar les habitacions amb zoom
Si voleu començar a utilitzar Fulls de càlcul de Google com a base de dades, haureu de tenir una formació bàsica en programació bàsica. També necessitareu una API per fer compatible el full amb SQL i Python. Tot i que Google ofereix una API completa per als seus serveis, pot ser que sigui massa excessiva. Per tant, us recomanem full2api o bé Autocode per resoldre la necessitat de l'API. Els serveis de l'API proporcionaran la connexió i les autenticacions necessàries per connectar els vostres fulls de càlcul de Google com a base de dades i oferiran punts finals suficients per permetre un flux de treball adequat de la base de dades.
El principal avantatge d’utilitzar Fulls de càlcul de Google com a base de dades és que sempre podeu tenir una visió general de totes les dades. Com que Fulls de càlcul de Google està disponible com a aplicació per a dispositius mòbils i és compatible amb la majoria de navegadors i sistemes operatius, es pot accedir a la vostra base de dades des de qualsevol lloc del món. També podeu visualitzar i editar directament les dades del full en lloc d’utilitzar codi per executar una consulta a través de la base de dades per fer canvis.
No obstant això, Fulls de càlcul de Google té les seves limitacions en la gestió de bases de dades. Per una banda, hi ha una clara manca de funcions relacionals. Les bases de dades solen estar compostes per moltes taules que utilitzen claus externes per comunicar-se entre elles, un procés que simplement no existeix en un sol full de càlcul.
Si voleu veure un exemple, tingueu en compte els departaments de la vostra empresa. En un full de càlcul, normalment només serien cadenes mecanografiades. Tanmateix, això no és prudent per a un conjunt de dades més gran. A les bases de dades, hi hauria una taula separada per als departaments de l’empresa, amb cada departament numerat en conseqüència. A continuació, faríeu referència al número del departament a les dades sobre un empleat mitjançant una clau estrangera. Disposar d’una taula de departaments independent us permet fer canvis directes als propis departaments sense executar-los a tota la base de dades.
A més, Fulls de càlcul de Google només pot emmagatzemar cinc milions de cel·les alhora. Tot i que això pot semblar un gran nombre, fins i tot les empreses mitjanes poden tenir bases de dades que superin molt aquest límit. A més, assolireu problemes de rendiment molt més ràpid abans d’arribar al límit de cel·les. Amb una escala aparentment lineal entre el nombre de cel·les i el rendiment, tindreu retards significatius en treballar amb una base de dades que conté 100 mil cel·les.
Preguntes freqüents addicionals
Podeu inserir dades a Fulls de càlcul de Google?
L’API incorporada de Google us permet inserir una taula directament des de fitxers. L'eina d'importació de fitxers admet les extensions següents:
• .xls
• .xlsx
• .xlsm
• .xlt
• .xltx
• .xltm
• .ods
• .csv
• .txt
• .tsv
• .tab
A més, el programari de tercers sol tenir integracions amb Fulls de càlcul de Google. Sheets2api i Autocode, que hem comentat anteriorment, tenen solucions API per proporcionar inserció de dades a taules existents.
També podeu utilitzar la funció IMPORTRANGE per inserir dades d’un full de Google a un altre.
Google també té instruccions de seqüència d’ordres per escriure contingut en un full de càlcul.
Si aconsegueu trobar una solució API que us funcioni, podeu inserir dades fàcilment a Fulls de càlcul de Google un cop hàgiu connectat la vostra plataforma.
com enviar correus electrònics a una carpeta a Outlook
Com puc netejar dades a Fulls de càlcul de Google?
Fulls de càlcul de Google ofereix diverses solucions per netejar i ordenar les dades.
Si utilitzeu Google Forms per recollir els resultats de les enquestes, podeu configurar formularis per enganxar respostes automàticament en un full de càlcul en lloc d'enganxar les dades manualment.
Fulls de càlcul de Google també té una funció de validació de dades. Si aneu a Dades> Validació de dades, podeu configurar funcions de validació per evitar valors incorrectes. Per exemple, podeu fer una llista d'elements que es poden col·locar en una columna concreta i provar d'inserir qualsevol altra cosa donarà lloc a un error.
Fulls de càlcul de Google també té opcions per suprimir duplicats i retallar espais en blanc. Això eliminarà els valors i espais en blanc addicionals de les vostres files i cel·les.
com desar un gif a twitter
Si voleu enganxar més dades organitzades de pàgines en línia, utilitzeu IMPORTHTML o IMPORTXML per obtenir la informació que necessiteu d'una pàgina web, sense la molèstia addicional.
Què significa normalitzar les dades?
A les estadístiques, normalitzar les dades us permetrà fer conjunts de dades variats més comparables.
Quan normalitzeu les dades, podeu canviar l'interval de valors numèrics originals per un interval que trieu. Per exemple, podeu normalitzar diferents mètodes de puntuació en el mateix interval de valors per comparar-los entre ells.
Normalitzar un valor x que prové d’un interval (y, z) a un interval (a, b) es fa mitjançant la fórmula següent:
X_normalitzat = (b - a) * ((x - y) / (z - y)) + a
Normalitzar les dades és útil quan els vostres conjunts de dades originals no tenen valors nets. Per exemple, estandarditzar els intervals a (0,100) pot ajudar a proporcionar una visió general ràpida de les puntuacions independentment del valor màxim de les puntuacions.
Un mètode estadístic addicional en l'avaluació de dades és l'estandardització. Això fa que els valors numèrics originals tinguin una mitjana de 0 i una desviació estàndard de 1. Els valors estandarditzats se solen anomenar puntuacions z.
Fulls de càlcul de Google té una funció que us permet estandarditzar un conjunt de dades. La funció STANDARDIZE (x, mitjana, standard_dev) posarà el valor numèric, x, en la seva forma estandarditzada. Podeu utilitzar la funció MITJÀ (interval) per obtenir el valor mitjà de les vostres dades a la taula i utilitzar la funció ST_DEV (interval) per calcular la desviació estàndard del conjunt de dades.
La interpretació de dades estandarditzades és una mica diferent. Per exemple, un nombre estandarditzat de -1,5 significa que el valor original és menor que la mitjana 1,5 vegades la desviació estàndard del conjunt.
La normalització pot ser útil per comparar els valors de diferents conjunts de dades amb diferents expectatives i mitjans. Com que una estandardització sempre posa la mitjana a 0 i una desviació a 1, els valors reals presentats al conjunt de dades no interferiran en la comparació.
L'anàlisi estadística també pot transformar un conjunt de dades per adaptar-se a una distribució concreta, però aquesta és una característica estadística avançada que no es tractarà en aquesta guia.
Nova normal
Normalitzar conjunts de dades és una eina increïblement útil en l'anàlisi de dades i Fulls de càlcul de Google ofereix una solució ràpida per normalitzar les dades numèriques. A més, podeu utilitzar Fulls de càlcul de Google com a petita base de dades, si no treballeu amb quantitats extraordinàries de conjunts de dades per al vostre treball. Les integracions de Fulls de càlcul de Google amb programes de tercers ho fan adequat per a una àmplia gamma d’indústries. No obstant això, les bases de dades adequades seran molt més escalables.
Quin tipus d'informació soleu normalitzar a Fulls de càlcul de Google? Feu servir Fulls de càlcul de Google per a la vostra base de dades? Feu-nos-ho saber a la secció de comentaris a continuació.