python pandas.DataFrame.loc函数使用详解_dataframe loc-程序员宅基地

技术标签: python  loc函数  

官方函数

DataFrame.loc
Access a group of rows and columns by label(s) or a boolean array.
.loc[] is primarily label based, but may also be used with a boolean array.
# 可以使用label值,但是也可以使用布尔值

  • Allowed inputs are: # 可以接受单个的label,多个label的列表,多个label的切片
  • A single label, e.g. 5 or ‘a", (note that 5 is interpreted as a label of the index, and never as an integer position along the index). #这里的5不是数值指定的位置,而是label值
  • A list or array of labels, e.g. [‘a", ‘b", ‘c"].

slice object with labels, e.g. ‘a":"f".

Warning: #如果使用多个label的切片,那么切片的起始位置都是包含的

Note that contrary to usual python slices, both the start and the stop are included

  • A boolean array of the same length as the axis being sliced, e.g. [True, False, True].

实例详解

一、选择数值

1、生成df

df = pd.DataFrame([[1, 2], [4, 5], [7, 8]],
...   index=["cobra", "viper", "sidewinder"],
...   columns=["max_speed", "shield"])

df
Out[15]: 
      max_speed shield
cobra        1    2
viper        4    5
sidewinder     7    8

2、Single label. 单个 row_label 返回的Series

df.loc["viper"]
Out[17]: 
max_speed  4
shield    5
Name: viper, dtype: int64

2、List of labels. 列表 row_label 返回的DataFrame

df.loc[["cobra","viper"]]
Out[20]: 
    max_speed shield
cobra     1    2
viper     4    5

3、Single label for row and column 同时选定行和列

df.loc["cobra", "shield"]
Out[24]: 2

4、Slice with labels for row and single label for column. As mentioned above, note that both the start and stop of the slice are included. 同时选定多个行和单个列,注意的是通过列表选定多个row label 时,首位均是选定的。

df.loc["cobra":"viper", "max_speed"]
Out[25]: 
cobra  1
viper  4
Name: max_speed, dtype: int64

5、Boolean list with the same length as the row axis 布尔列表选择row label
布尔值列表是根据某个位置的True or False 来选定,如果某个位置的布尔值是True,则选定该row

df
Out[30]: 
      max_speed shield
cobra        1    2
viper        4    5
sidewinder     7    8

df.loc[[True]]
Out[31]: 
    max_speed shield
cobra     1    2

df.loc[[True,False]]
Out[32]: 
    max_speed shield
cobra     1    2

df.loc[[True,False,True]]
Out[33]: 
      max_speed shield
cobra        1    2
sidewinder     7    8

6、Conditional that returns a boolean Series 条件布尔值

df.loc[df["shield"] > 6]
Out[34]: 
      max_speed shield
sidewinder     7    8

7、Conditional that returns a boolean Series with column labels specified 条件布尔值和具体某列的数据

df.loc[df["shield"] > 6, ["max_speed"]]
Out[35]: 
      max_speed
sidewinder     7

8、Callable that returns a boolean Series 通过函数得到布尔结果选定数据

df
Out[37]: 
      max_speed shield
cobra        1    2
viper        4    5
sidewinder     7    8

df.loc[lambda df: df["shield"] == 8]
Out[38]: 
      max_speed shield
sidewinder     7    8

二、赋值

1、Set value for all items matching the list of labels 根据某列表选定的row 及某列 column 赋值

df.loc[["viper", "sidewinder"], ["shield"]] = 50

df
Out[43]: 
      max_speed shield
cobra        1    2
viper        4   50
sidewinder     7   50

2、Set value for an entire row 将某行row的数据全部赋值

df.loc["cobra"] =10

df
Out[48]: 
      max_speed shield
cobra       10   10
viper        4   50
sidewinder     7   50

3、Set value for an entire column 将某列的数据完全赋值

df.loc[:, "max_speed"] = 30

df
Out[50]: 
      max_speed shield
cobra       30   10
viper       30   50
sidewinder     30   50

4、Set value for rows matching callable condition 条件选定rows赋值

df.loc[df["shield"] > 35] = 0

df
Out[52]: 
      max_speed shield
cobra       30   10
viper        0    0
sidewinder     0    0

三、行索引是数值

df = pd.DataFrame([[1, 2], [4, 5], [7, 8]],
...   index=[7, 8, 9], columns=["max_speed", "shield"])

df
Out[54]: 
  max_speed shield
7     1    2
8     4    5
9     7    8

通过 行 rows的切片的方式取多个:

df.loc[7:9]
Out[55]: 
  max_speed shield
7     1    2
8     4    5
9     7    8

四、多维索引

1、生成多维索引

tuples = [
...  ("cobra", "mark i"), ("cobra", "mark ii"),
...  ("sidewinder", "mark i"), ("sidewinder", "mark ii"),
...  ("viper", "mark ii"), ("viper", "mark iii")
... ]
index = pd.MultiIndex.from_tuples(tuples)
values = [[12, 2], [0, 4], [10, 20],
...     [1, 4], [7, 1], [16, 36]]
df = pd.DataFrame(values, columns=["max_speed", "shield"], index=index)


df
Out[57]: 
           max_speed shield
cobra   mark i      12    2
      mark ii      0    4
sidewinder mark i      10   20
      mark ii      1    4
viper   mark ii      7    1
      mark iii     16   36

2、Single label. 传入的就是最外层的row label,返回DataFrame

df.loc["cobra"]
Out[58]: 
     max_speed shield
mark i     12    2
mark ii     0    4

3、Single index tuple.传入的是索引元组,返回Series

df.loc[("cobra", "mark ii")]
Out[59]: 
max_speed  0
shield    4
Name: (cobra, mark ii), dtype: int64

4、Single label for row and column.如果传入的是row和column,和传入tuple是类似的,返回Series

df.loc["cobra", "mark i"]
Out[60]: 
max_speed  12
shield    2
Name: (cobra, mark i), dtype: int64

5、Single tuple. Note using [[ ]] returns a DataFrame.传入一个数组,返回一个DataFrame

df.loc[[("cobra", "mark ii")]]
Out[61]: 
        max_speed shield
cobra mark ii     0    4

6、Single tuple for the index with a single label for the column 获取某个colum的某row的数据,需要左边传入多维索引的tuple,然后再传入column

df.loc[("cobra", "mark i"), "shield"]
Out[62]: 2

7、传入多维索引和单个索引的切片:

df.loc[("cobra", "mark i"):"viper"]
Out[63]: 
           max_speed shield
cobra   mark i      12    2
      mark ii      0    4
sidewinder mark i      10   20
      mark ii      1    4
viper   mark ii      7    1
      mark iii     16   36

df.loc[("cobra", "mark i"):"sidewinder"]
Out[64]: 
          max_speed shield
cobra   mark i     12    2
      mark ii     0    4
sidewinder mark i     10   20
      mark ii     1    4

df.loc[("cobra", "mark i"):("sidewinder","mark i")]
Out[65]: 
          max_speed shield
cobra   mark i     12    2
      mark ii     0    4
sidewinder mark i     10   20
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/QQ315806208/article/details/113860980

智能推荐

C++ vector 初始化使用笔记_初始化vector数组-程序员宅基地

文章浏览阅读637次。vector 初始化_初始化vector数组

JAVA多线程详解(超详细)-程序员宅基地

文章浏览阅读1w次,点赞12次,收藏51次。程序:开发写的代码称之为程序。程序就是一堆代码,一组数据和指令集,是一个静态的概念。进程(Process):将程序运行起来,我们称之为进程。进程是执行程序的一次执行过程,它是动态的概念。进程存在生命周期,也就是说程序随着程序的终止而销毁。进程之间是通过TCP/IP端口实现交互的。线程(Thread):线程是进程中的实际运作的单位,是进程的一条流水线,是程序的实际执行者,是最小的执行单位。通常在一个进程中可以包含若干个线程,当然一个进程中至少有一个线程。线程是CPU调度和执行的最小单位。注意。_java多线程

快乐的用vscode刷LeetCode题目_vacod怎么刷leetco题目-程序员宅基地

文章浏览阅读1.3k次,点赞2次,收藏5次。vscode是一款越来越受码农们喜爱的软件,大多数人学习编程绕不开的一部分就是算法,很多人都喜欢刷LeetCode的题目,本篇文章就讲述如何用vscode快乐的刷LeetCode的题目。首先我们需要准备vscode这个软件,可以去官网自行下载。下载地址:https://code.visualstudio.com/。傻瓜式安装即可,安装完成后打开软件,如果英文看不习惯可安装中文插件(vscode的大量插件拓展让这个软件变得深受喜爱)。一、首先点击应用商店,输入language搜索,选择中文简体,点击安装_vacod怎么刷leetco题目

【Scikit-Learn 中文文档】流形学习 - 监督学习 - 用户指南 | ApacheCN-程序员宅基地

文章浏览阅读143次。中文文档:http://sklearn.apachecn.org/cn/stable/modules/manifold.html 英文文档:http://sklearn.apachecn.org/en/stable/modules/manifold.html 官方文档:http://..._arpack用户指南,

分布式基础(四)——分布式理论之分布式一致性:Paxos算法-程序员宅基地

文章浏览阅读793次,点赞14次,收藏17次。通过本章的讲解 ,我们应该理解了Paxos算法的核心内容:Basic Paxos算法和Multi-Paxos 思想。Basic Paxos 是经过证明的,而 Multi-Paxos 是一种思想,缺失实现算法的必须编程细节,这就导致Multi-Paxos 的最终算法实现,是建立在一个未经证明的基础之上的,正确性是个问号。所以在实际使用时,不推荐设计和实现新的 Multi-Paxos 算法,而是建议优先考虑 Raft 算法,因为 Raft 的正确性是经过证明的。

传统TCP拥塞控制算法详解一(TCP Reno传统拥塞控制算法)_用matlab比较慢启动算法和tcp reno算法-程序员宅基地

文章浏览阅读164次。传统的TCP拥塞控制算法AIMD,TCP Reno算法_用matlab比较慢启动算法和tcp reno算法

随便推点

下列哪一个是c语言中不合法的变量,C语言程序设计(山东联盟)-程序员宅基地

文章浏览阅读2.1k次。第一章 单元测试1、问题:01110011:流程图中用下列哪一个图形符号表示判断?()选项:A:矩形框B:菱形框C:平行四边形框D:圆形框答案: 【菱形框】2、问题:01110021:流程图中用下列哪种图形符号表示事情处理过程的开始?(选项:A:圆括号矩形B:矩形C:箭头D:圆圈答案: 【圆括号矩形】3、问题:01110031:流程图中用于描述输出的是下列哪一个图形符号?选项:A:矩形框B:菱形框..._c语言不合法的变量

Linux下部署Mysql_linux 部署mysql-程序员宅基地

文章浏览阅读441次。目录概述环境说明准备内容部署步骤(部分步骤可忽略)概述本文介绍在Linux下部署Mysql的详细步骤,以供参考。环境说明OS Version:CentOS Linux release 8.1.1911 (此为发行版本)Linux下查看系统版本命令查看系统发行版本:cat /etc/redhat-release查看系统内核版本:uname -a准备内容Linux文件命令行工具Xshell 4下载地址链接:https://pan.baidu.com/s/1yBHjFQeD5IxOl_linux 部署mysql

【内网开发之pkg打包nodejs项目踩坑实践】_nodejs pkg 指定node-程序员宅基地

文章浏览阅读1.3k次,点赞22次,收藏25次。最近新入职新公司,内网开发()。将现有nodejs服务打包成指定平台(国产麒麟系统V10,arm64架构)可执行文件交付,避免源代码泄露。在我完完全全掌握了他的原理后,我终于解决了我所遇到的坑,特此记录学习,参考(基于es6规范封装 Express + DM8 + WebSocket + PKG )_nodejs pkg 指定node

python - 简单算法题 - 列表偏移_列表偏移:现有lst = [1,2,3,4,5],将列表向右偏移2位后,变成lst = [4,5,1-程序员宅基地

文章浏览阅读887次。列表偏移来源:http://www.coolpython.net/python_primary/algorithm_exercises/easy_list_shift.html题目要求lst = [1,2,3,4,5],列表向右偏移两位后,变成lst = [4,5,1,2,3]思路分析第一种方式:用切片将 [1,2,3] 和 [4,5] 取出来,之后合并在一起lst = [1,2,3,4,5]result = lst[3:]+lst[:3]print(result)或者lst = [_列表偏移:现有lst = [1,2,3,4,5],将列表向右偏移2位后,变成lst = [4,5,1,2,3]

MySQL之PXC集群搭建_gcomm://-程序员宅基地

文章浏览阅读366次。一、PXC 介绍1.1 PXC 简介PXC是一套MySQL高可用集群解决方案,与传统的基于主从复制模式的集群架构相比 PXC 最突出特点就是解决了诟病已久的数据复制延迟问题,基本上可以达到实时同步。而且节点与节点之间,他们相互的关系是对等的。PXC 最关注的是数据的一致性,对待事物的行为时,要么在所有节点上执行,要么都不执行,它的实现机制决定了它对待一致性的行为非常严格,这也能非常完美的保证 MySQL 集群的数据一致性;1.2 PXC特性和优点完全兼容 MySQL。 同步复制,事务..._gcomm://

动力电池MES系统方案_锂电池mes系统-程序员宅基地

文章浏览阅读487次,点赞5次,收藏4次。总之,MES系统是一种强大的生产管理工具,可以帮助企业提高生产效率、优化生产流程、降低成本、提高产品质量和客户满意度。_锂电池mes系统

推荐文章

热门文章

相关标签