issue141:python
Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
issue141:python [2019/01/31 10:32] – auntiee | issue141:python [2019/02/08 16:06] (Version actuelle) – andre_domenech | ||
---|---|---|---|
Ligne 86: | Ligne 86: | ||
Toutes les données sont bien là, mais Pandas ne montre qu'une partie des informations de la DataFrame. | Toutes les données sont bien là, mais Pandas ne montre qu'une partie des informations de la DataFrame. | ||
- | Maintenant, | + | Maintenant, |
**# get and display a list of the column names (headers) | **# get and display a list of the column names (headers) | ||
Ligne 118: | Ligne 118: | ||
[' | [' | ||
- | nous pouvons également tout simplement appeler « df.count() » et quelque chose comme ceci nous sera présenté... | + | nous pouvons également tout simplement appeler « df.count() » et quelque chose comme ceci nous sera présenté |
print(df.count()) | print(df.count()) | ||
Ligne 141: | Ligne 141: | ||
Keep the datelist variable in mind for later on.** | Keep the datelist variable in mind for later on.** | ||
- | Jusqu' | + | Jusqu' |
datelist = df[' | datelist = df[' | ||
- | Ensuite, nous pouvons imprimer la longueur de la liste pour savoir combien elle possède de dates uniques. Nous pouvons aussi inclure les dates la plus proche et la plus lointaine pour lesquelles nous avons des données. | + | Ensuite, nous pouvons imprimer la longueur de la liste pour savoir combien elle possède de dates uniques. Nous pouvons aussi inclure les dates la plus proche et la plus lointaine pour lesquelles nous avons des données |
print(len(datelist), | print(len(datelist), | ||
- | dont les résultats sont… | + | dont les résultats sont : |
159 2016-10-30 2017-04-09 | 159 2016-10-30 2017-04-09 | ||
Ligne 195: | Ligne 195: | ||
We know that our data is broken down by date, time of each sale (transaction) and each item sold. In addition, each sale has a unique transaction number that is duplicated if there were multiple items in that sale. For example, let's look at two sales (shown above).** | We know that our data is broken down by date, time of each sale (transaction) and each item sold. In addition, each sale has a unique transaction number that is duplicated if there were multiple items in that sale. For example, let's look at two sales (shown above).** | ||
- | Avant d' | + | Avant d' |
• Par jour, combien d' | • Par jour, combien d' | ||
• Par article, quels ont été les plus vendus ? Quels sont les 10 moins bien vendus ? | • Par article, quels ont été les plus vendus ? Quels sont les 10 moins bien vendus ? | ||
• Par jour, quels sont les périodes les plus actives ? | • Par jour, quels sont les périodes les plus actives ? | ||
- | Avant de pouvoir répondre à ces questions, nous devons monter un plan pour chacune. Aussi, commençons avec la question n°1... | + | Avant de pouvoir répondre à ces questions, nous devons monter un plan pour chacune. Aussi, commençons avec la question n°1. |
Par jour, combien d' | Par jour, combien d' | ||
Ligne 222: | Ligne 222: | ||
La vente n°2 (transaction 1955) s'est terminée le même jour à 10:23:10, pour deux articles. | La vente n°2 (transaction 1955) s'est terminée le même jour à 10:23:10, pour deux articles. | ||
- | Aussi, comment pourrions-nous structurer notre recherche pour accomplir cette tâche ? Si je ne regardais qu'un seul jour, je prendrais tous les enregistrements du jour dit et trierais les enregistrements par articles vendus. Ensuite, je compterais chaque article unique qui a été vendu ce jour-là. En utilisant les cinq enregistrements ci-dessus, ça ressemblerait à quelque chose comme ceci... | + | Aussi, comment pourrions-nous structurer notre recherche pour accomplir cette tâche ? Si je ne regardais qu'un seul jour, je prendrais tous les enregistrements du jour dit et trierais les enregistrements par articles vendus. Ensuite, je compterais chaque article unique qui a été vendu ce jour-là. En utilisant les cinq enregistrements ci-dessus, ça ressemblerait à quelque chose comme ceci : |
Date | Date | ||
Ligne 254: | Ligne 254: | ||
byDate = df.groupby([' | byDate = df.groupby([' | ||
- | Ainsi, nous savons maintenant comment obtenir les informations pour le patron pour la question n°1. Et pour la question n° 2... | + | Ainsi, nous savons maintenant comment obtenir les informations pour le patron pour la question n°1. Et pour la question n° 2 : |
N° 2 - Par Item, quels sont ceux les plus vendus ? Et les 10 moins bien vendus ? | N° 2 - Par Item, quels sont ceux les plus vendus ? Et les 10 moins bien vendus ? | ||
Ligne 336: | Ligne 336: | ||
Next month, we’ll continue dealing with Pandas and Python, this time looking at a different dataset. Until then, have fun!** | Next month, we’ll continue dealing with Pandas and Python, this time looking at a different dataset. Until then, have fun!** | ||
- | Nous avons maintenant les réponses pour notre patron ; et encore une fois, tout ce travail aurait pu être fait dans un shell Python. J'ai créé un programme simple qui contient toutes les choses que nous avons faites dans un fichier facile à visualiser. Vous pouvez le trouver sur pastebin à https:// | + | Nous avons maintenant les réponses pour notre patron ; et encore une fois, tout ce travail aurait pu être fait dans un shell Python. J'ai créé un programme simple qui contient toutes les choses que nous avons faites dans un fichier facile à visualiser. Vous pouvez le trouver sur pastebin à https:// |
Le mois prochain, nous continuerons à traiter de Pandas et Python, en regardant ce coup-là un jeu de données différent. Jusque là, amusez-vous bien ! | Le mois prochain, nous continuerons à traiter de Pandas et Python, en regardant ce coup-là un jeu de données différent. Jusque là, amusez-vous bien ! | ||
issue141/python.1548927166.txt.gz · Dernière modification : 2019/01/31 10:32 de auntiee