sql >> Base de Datos >  >> RDS >> Mysql

¿Cómo insertar datos de un archivo CSV en MYSQL usando Python de manera eficiente?

Hay muchas formas de optimizar este inserto. Aquí hay algunas ideas:

  1. Tiene un bucle for sobre todo el conjunto de datos. Puedes hacer un commit() cada 100 más o menos
  2. Puede insertar muchas filas en una inserción
  3. puede combinar los dos y hacer una inserción de varias filas cada 100 filas en su CSV
  4. Si Python no es un requisito para usted, puede hacerlo directamente usando MySQL como se explica aquí . (Si debe hacerlo usando python, aún puede preparar esa declaración en python y evitar recorrer el archivo manualmente).

Ejemplos:

para el número 2 de la lista, el código tendrá la siguiente estructura:

def csv_to_DB(xing_csv_input, db_opts):
    print("Inserting csv file {} to database {}".format(xing_csv_input, db_opts['host']))
    conn = pymysql.connect(**db_opts)
    cur = conn.cursor()
    try:
        with open(xing_csv_input, newline='') as csvfile:
            csv_data = csv.reader(csvfile, delimiter=',', quotechar='"')
            to_insert = []
            insert_str = "INSERT INTO table_x (ID, desc, desc_version, val, class) VALUES "
            template = '(%s, %s, %s, %s, %s)'
            count = 0
            for row in csv_data:
                count += 1
                to_insert.append(tuple(row))
                if count % 100 == 0:
                    query = insert_str + '\n'.join([template % r for r in to_insert])
                    cur.execute(query)
                    to_insert = []
                    conn.commit()
            query = insert_str + '\n'.join(template % to_insert)
            cur.execute(query)
            conn.commit()
    finally:
        conn.close()