MongoDB数据库简笔_ufly哪个航空-程序员宅基地

技术标签: 爬虫  mongodb  Python  

MongoDB数据库

0x00 介绍

MongoDB是一个面向文档存储的非关系型数据库,是用C++编写的。
MongoDB将数据存储为一个文档,数据结构由“键值对”组成,字段值
可以包含其他文档、数组及文档数组,类似于JSON对象,如下格式:

{
    "name": "Scrapy爬虫网络",
    "description": "做一个Scrapy爬虫达人",
    "author": "["张三","李四"]",
    "price": "59",
}

MongoDB与SQL对应的术语:

SQL MongoDB
术语 英文术语 术语 英文术语
数据库 database 数据库 database
table 集合 collection
row 文档 document
column field
索引 index 索引 index
主键 primary key 主键 primary key

0x01 安装MongoDB(略)

0x02 利用python访问MongoDB数据库

1、 安装pymongo

pip install pymongo

2、 连接MongoDB数据库

import pymongo
# 方式一:使用默认的host和port
db_client = pymongo.MongoClient()

# 方式二:自定义host和port参数
db_client = pymongo.MongoClient(host="localhost", port=27017)

# 方式三:使用标准的URI连接语法
db_client = pymongo.MongoClient("mongodb://localhost:27017")

3、 指定数据库

MongoDB可以建立多个数据库,以下代码指定了名称为qidian的数据库:

db = db_client["qidian"]

db_client是上一步中得到的客户端(client)对象,db是返回的数据对象。当然还可以这样指定数据库:

db = db_client.qidian

4、 指定集合(相当于关系型数据库中的表)

以下代码指定了要操作的集合为hot:

db_collection = db['hot']

5、 插入文档

(1)插入与条件匹配的单个文档
novel = {
    
    'name': '太初',
    'author':'高楼大厦',
    'form':'连载',
    'type':'玄幻'
    }
    
result = db_collection.insert_one(novel)
print(result)       # InsertOneResult类型对象
print(result.inserted_id)   # 添加文档的_id值,作为文档的唯一标识

(2) 插入与条件匹配的所有文档
novel1 = {
    
    'name': '斗罗大陆',
    'author':'唐家三少',
    'form':'完结',
    'type':'玄幻'
    }
novel2 = {
    
    'name': '帝国的崛起',
    'author':'终极侧位',
    'form':'连载',
    'type':'都市'
    }
result = db_collection.insert_many([novel1, novel2])
print(result)

6、 查询文档

(1) 查询与条件匹配的单个文档
result = db_collection.find_one({
    "name": "帝国的崛起"})

相当于

select * from hot where name = "帝国的崛起" LIMIT 0,1
(2) 查询所有文档
cursor = db_collection.find({
    })

相当于

select * from hot;
(3) 查询与条件匹配的所有文档
cursor = db_collection.find({
    "type": "历史"})
print(cursor)
for one in cursor:
    print(one)

相当于

select * from hot where type = "历史"

7、 更新文档

(1) 更新与条件匹配的单个文档
# 查询条件
filter = {
    "name":"帝国的崛起"}
# 更新语句
update = {
    "$set":{
    "type":"历史"}}
# 使用update_one()方法更新文档
result = db_collection.update_one(filter, update) 
print(result)               # 返回UpdateResult类型的对象
print(result.raw_result)    # 查看更新后的结果

filter是一个查询条件的字典,update是一个更新语句的字典,key为操作符$set,value为想要更新的字段,也是一个字典。

(2) 更新与条件匹配的所有文档
# 查询条件
filter = {
    "type":"历史"}
# 更新语句
update = {
    "$set":{
    "form":"完本"}}
# 使用update_many()方法更新文档
result = db_collection.update_many(filter, update) 
print(result)               # 返回UpdateResult类型的对象
print(result.raw_result)    # 查看更新后的结果

8、 删除文档

(1) 删除与条件匹配的单个文档
result = db_collection.delete_one({
    "name":"太初"})
print(result)
print(result.raw_result)
(2) 删除与条件匹配的所有文档
result = db_connection.delete_many({
    "type":"历史"})
print(result)
print(result.raw_result)

9、 关闭数据库

db_client.close()
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_42324313/article/details/108069393

智能推荐

解决win10/win8/8.1 64位操作系统MT65xx preloader线刷驱动无法安装_mt65驱动-程序员宅基地

文章浏览阅读1.3w次。转载自 http://www.miui.com/thread-2003672-1-1.html 当手机在刷错包或者误修改删除系统文件后会出现无法开机或者是移动定制(联通合约机)版想刷标准版,这时就会用到线刷,首先就是安装线刷驱动。 在XP和win7上线刷是比较方便的,用那个驱动自动安装版,直接就可以安装好,完成线刷。不过现在也有好多机友换成了win8/8.1系统,再使用这个_mt65驱动

SonarQube简介及客户端集成_sonar的客户端区别-程序员宅基地

文章浏览阅读1k次。SonarQube是一个代码质量管理平台,可以扫描监测代码并给出质量评价及修改建议,通过插件机制支持25+中开发语言,可以很容易与gradle\maven\jenkins等工具进行集成,是非常流行的代码质量管控平台。通CheckStyle、findbugs等工具定位不同,SonarQube定位于平台,有完善的管理机制及强大的管理页面,并通过插件支持checkstyle及findbugs等既有的流..._sonar的客户端区别

元学习系列(六):神经图灵机详细分析_神经图灵机方法改进-程序员宅基地

文章浏览阅读3.4k次,点赞2次,收藏27次。神经图灵机是LSTM、GRU的改进版本,本质上依然包含一个外部记忆结构、可对记忆进行读写操作,主要针对读写操作进行了改进,或者说提出了一种新的读写操作思路。神经图灵机之所以叫这个名字是因为它通过深度学习模型模拟了图灵机,但是我觉得如果先去介绍图灵机的概念,就会搞得很混乱,所以这里主要从神经图灵机改进了LSTM的哪些方面入手进行讲解,同时,由于模型的结构比较复杂,为了让思路更清晰,这次也会分开几..._神经图灵机方法改进

【机器学习】机器学习模型迭代方法(Python)-程序员宅基地

文章浏览阅读2.8k次。一、模型迭代方法机器学习模型在实际应用的场景,通常要根据新增的数据下进行模型的迭代,常见的模型迭代方法有以下几种:1、全量数据重新训练一个模型,直接合并历史训练数据与新增的数据,模型直接离线学习全量数据,学习得到一个全新的模型。优缺点:这也是实际最为常见的模型迭代方式,通常模型效果也是最好的,但这样模型迭代比较耗时,资源耗费比较多,实时性较差,特别是在大数据场景更为困难;2、模型融合的方法,将旧模..._模型迭代

base64图片打成Zip包上传,以及服务端解压的简单实现_base64可以装换zip吗-程序员宅基地

文章浏览阅读2.3k次。1、前言上传图片一般采用异步上传的方式,但是异步上传带来不好的地方,就如果图片有改变或者删除,图片服务器端就会造成浪费。所以有时候就会和参数同步提交。笔者喜欢base64图片一起上传,但是图片过多时就会出现数据丢失等异常。因为tomcat的post请求默认是2M的长度限制。2、解决办法有两种:① 修改tomcat的servel.xml的配置文件,设置 maxPostSize=..._base64可以装换zip吗

Opencv自然场景文本识别系统(源码&教程)_opencv自然场景实时识别文字-程序员宅基地

文章浏览阅读1k次,点赞17次,收藏22次。Opencv自然场景文本识别系统(源码&教程)_opencv自然场景实时识别文字

随便推点

ESXi 快速复制虚拟机脚本_exsi6.7快速克隆centos-程序员宅基地

文章浏览阅读1.3k次。拷贝虚拟机文件时间比较长,因为虚拟机 flat 文件很大,所以要等。脚本完成后,以复制虚拟机文件夹。将以下脚本内容写入文件。_exsi6.7快速克隆centos

好友推荐—基于关系的java和spark代码实现_本关任务:使用 spark core 知识完成 " 好友推荐 " 的程序。-程序员宅基地

文章浏览阅读2k次。本文主要实现基于二度好友的推荐。数学公式参考于:http://blog.csdn.net/qq_14950717/article/details/52197565测试数据为自己随手画的关系图把图片整理成文本信息如下:a b c d e f yb c a f gc a b dd c a e h q re f h d af e a b gg h f bh e g i di j m n ..._本关任务:使用 spark core 知识完成 " 好友推荐 " 的程序。

南京大学-高级程序设计复习总结_南京大学高级程序设计-程序员宅基地

文章浏览阅读367次。南京大学高级程序设计期末复习总结,c++面向对象编程_南京大学高级程序设计

4.朴素贝叶斯分类器实现-matlab_朴素贝叶斯 matlab训练和测试输出-程序员宅基地

文章浏览阅读3.1k次,点赞2次,收藏12次。实现朴素贝叶斯分类器,并且根据李航《统计机器学习》第四章提供的数据训练与测试,结果与书中一致分别实现了朴素贝叶斯以及带有laplace平滑的朴素贝叶斯%书中例题实现朴素贝叶斯%特征1的取值集合A1=[1;2;3];%特征2的取值集合A2=[4;5;6];%S M LAValues={A1;A2};%Y的取值集合YValue=[-1;1];%数据集和T=[ 1,4,-1;..._朴素贝叶斯 matlab训练和测试输出

Markdown 文本换行_markdowntext 换行-程序员宅基地

文章浏览阅读1.6k次。Markdown 文本换行_markdowntext 换行

错误:0xC0000022 在运行 Microsoft Windows 非核心版本的计算机上,运行”slui.exe 0x2a 0xC0000022″以显示错误文本_错误: 0xc0000022 在运行 microsoft windows 非核心版本的计算机上,运行-程序员宅基地

文章浏览阅读6.7w次,点赞2次,收藏37次。win10 2016长期服务版激活错误解决方法:打开“注册表编辑器”;(Windows + R然后输入Regedit)修改SkipRearm的值为1:(在HKEY_LOCAL_MACHINE–》SOFTWARE–》Microsoft–》Windows NT–》CurrentVersion–》SoftwareProtectionPlatform里面,将SkipRearm的值修改为1)重..._错误: 0xc0000022 在运行 microsoft windows 非核心版本的计算机上,运行“slui.ex