mongodb数据库集合(表)的创建和数据修改
一、集合的创建1.需求分析2.代码实现二、集合的修改
前言
为了巩固所学的知识,作者尝试着开始发布一些学习笔记类的博客,方便日后回顾。当然,如果能帮到一些萌新进行新技术的学习那也是极好的。作者菜菜一枚,文章中如果有记录错误,欢迎读者朋友们批评指正。
(博客的参考源码可以在我主页的资源里找到,如果在学习的过程中有什么疑问欢迎大家在评论区向我提出)
发现宝藏
前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。【宝藏入口】。
一、集合的创建
一、版面集合: catalogues
主键id(数据类型为整形)
关键字:keywords(数据类型为字符串)
isFuzzy: 0
搜索位置:searchArea(数据类型为字符串)
时间筛选:year(数据类型为时间类)
类型:form(数据类型为字符串)
领域:type(数据类型为字符串)
第几页:page(数据类型为整型)
来源:origin(数据类型为字符串)
source: 2
更新时间:updateTime(数据类型为时间类)
二、内容 cards
主键:id (数据类型为整形)
标题:title
来源: origin
原始网页html dom结构:htmlcontent
清洗后的html dom结构:content
第几页:page(数据类型为字符串)
搜索位置:searchArea(数据类型为字符串)
时间筛选:year(数据类型为时间类)
类型:form(数据类型为字符串)
领域:type(数据类型为字符串)
地址:url(数据类型为字符串)
内容图片存储的位置:illustrations(数据类型为数组)
更新时间:updateTime(数据类型为时间类)
为了生成 MongoDB 数据库,你首先需要安装 MongoDB 数据库服务器,并确保你的 Python 环境中安装了 PyMongo,这是 MongoDB 官方提供的 Python 驱动程序。
接下来,你可以按照以下步骤创建一个 Python 脚本来实现数据库的创建和数据插入:
1.安装 MongoDB:在你的机器上安装 MongoDB 数据库服务器。你可以从 MongoDB 官方网站下载安装程序并按照说明进行安装。
’
2.安装 PyMongo:在你的 Python 环境中安装 PyMongo 包。你可以通过 pip 进行安装:
pip install pymongo
3.编写 Python 脚本:编写一个 Python 脚本来连接 MongoDB,并创建两个集合(catalogues 和 cards),然后将数据插入这两个集合。
下面是一个示例 Python 脚本:
from datetime import datetime
from pymongo import MongoClient
# 连接 MongoDB 数据库服务器
client = MongoClient('mongodb://localhost:27017/')
# 创建或选择数据库
db = client['my_database']
# 创建或选择集合
catalogues_collection = db['catalogues']
cards_collection = db['cards']
# 插入示例数据到 catalogues 集合
catalogue_data = {
'id': 1,
'keywords': 'example keyword',
'isFuzzy': '0',
'searchArea': 'example search area',
'year': datetime(2023, 1, 1),
'form': 'example form',
'type': 'example type',
'page': 1,
'origin': 'example origin',
'source': 2,
'updateTime': datetime.now()
}
catalogues_collection.insert_one(catalogue_data)
# 插入示例数据到 cards 集合
card_data = {
'id': 1,
'title': 'Example Title',
'origin': 'example origin',
'htmlcontent': '<html>Example HTML content</html>',
'content': 'Example content',
'page': 'example page',
'searchArea': 'example search area',
'year': datetime(2023, 1, 1),
'form': 'example form',
'type': 'example type',
'url': 'example url',
'illustrations': ['illustration1.jpg', 'illustration2.jpg'],
'updateTime': datetime.now()
}
cards_collection.insert_one(card_data)
# 输出成功信息
print("Data inserted successfully into MongoDB.")
请注意,这只是一个示例脚本,用于演示如何连接 MongoDB 并将数据插入数据库中。在实际应用中,你可能需要根据你的需求来调整代码和数据结构。
二、集合的修改
要修改 MongoDB 中集合(Collection)的结构,你需要执行以下步骤:
1.连接到 MongoDB 数据库:首先,使用 Python 的 PyMongo 模块或 MongoDB 的客户端工具连接到你的 MongoDB 数据库。
2.备份数据:在修改集合结构之前,强烈建议对数据进行备份,以防止意外数据丢失。
3.修改集合结构:根据你的需求,修改集合结构可能涉及添加、删除或修改字段,或者重命名集合。下面是一些常见的操作:
-添加字段:可以通过更新现有文档或添加新文档的方式来添加字段。
-删除字段:使用 $unset 操作符从现有文档中删除字段。
-修改字段:可以使用 $set 操作符来修改现有文档中的字段值。
-重命名集合:使用 rename_collection() 方法重命名集合。
-验证修改:在修改集合结构后,验证修改是否正确。你可以查询集合以确保修改已成功应用,并且数据仍然可用和完整。
-更新应用程序代码:如果修改了集合结构,确保更新你的应用程序代码以反映这些更改。
以下是一个使用 PyMongo 修改 MongoDB 集合结构的示例代码:
from pymongo import MongoClient
# 连接到 MongoDB
client = MongoClient('mongodb://localhost:27017/')
db = client['my_database']
# 获取要修改的集合
collection = db['my_collection']
# 添加新字段到文档
collection.update_many({}, {"$set": {"new_field": "default_value"}})
# 删除字段
collection.update_many({}, {"$unset": {"old_field": 1}})
# 重命名集合
db.rename_collection('old_collection', 'new_collection')
# 验证修改
for doc in collection.find():
print(doc)
# 关闭连接
client.close()
在这个示例中,我们假设已经连接到了名为 my_database 的数据库,并且要修改其中名为 my_collection 的集合。我们添加了一个名为 new_field 的新字段,删除了名为 old_field 的旧字段,并将集合重命名为 new_collection。最后,我们验证了修改是否成功,并关闭了数据库连接。
三、数据插入数据库
为了将数据插入 MongoDB 数据库,你需要使用 PyMongo 模块来与 MongoDB 进行交互。在你的 main 函数中,你可以添加连接到数据库的代码,并在适当的地方插入数据。以下是一个简单的例子:
from pymongo import MongoClient
def main():
# 本地 MongoDB 连接信息
mongo_host = "127.0.0.1"
mongo_port = 27017
database_name = "your_database" # 替换为实际的数据库名称
collection_name = "your_collection" # 替换为实际的集合名称
# 连接到 MongoDB
client = MongoClient(mongo_host, mongo_port)
db = client[database_name]
collection = db[collection_name]
# 现有数据或需要插入到 MongoDB 的数据
data_to_insert = {
'field1': 'value1',
'field2': 'value2',
'field3': 'value3',
# 添加更多字段和值...
}
# 插入数据到 MongoDB 中的集合
collection.insert_one(data_to_insert)
# 关闭 MongoDB 连接
client.close()
# 程序主要逻辑...
if __name__ == "__main__":
main()
在上述代码中,替换 mongo_host、database_name 和 collection_name 为你实际的 MongoDB 连接信息和集合名称。然后,创建一个字典 data_to_insert 包含你要插入的字段和对应的值,最后使用 insert_one 方法将数据插入到 MongoDB 集合中。
确保在插入数据之前已经连接到了 MongoDB,并在完成数据插入后关闭连接。此外,确保在 main 函数中添加适当的程序逻辑,以便你的脚本执行其他操作。
四、清空数据库集合数据
清除 MongoDB 集合中的所有数据可以使用 delete_many({}) 方法,传入一个空的查询条件,这将删除集合中的所有文档。在你的情况下,你想要清除 catalogues 和 cards 集合中的所有数据,可以按照以下方式进行:
from pymongo import MongoClient
def clear_collection_data():
# 本地 MongoDB 连接信息
mongo_host = "127.0.0.1"
mongo_port = 27017
database_name = "your_database" # 替换为实际的数据库名称
catalogues_collection_name = "catalogues" # 替换为实际的集合名称
cards_collection_name = "cards" # 替换为实际的集合名称
# 连接到 MongoDB
client = MongoClient(mongo_host, mongo_port)
db = client[database_name]
# 清除 catalogues 集合中的所有数据
catalogues_collection = db[catalogues_collection_name]
catalogues_collection.delete_many({})
# 清除 cards 集合中的所有数据
cards_collection = db[cards_collection_name]
cards_collection.delete_many({})
# 关闭 MongoDB 连接
client.close()
if __name__ == "__main__":
clear_collection_data()
在这个例子中,我们定义了一个名为 clear_collection_data 的函数,它连接到 MongoDB,然后使用 delete_many({}) 方法清除了 catalogues 和 cards 集合中的所有数据。请确保替换连接信息、数据库名称以及集合名称为你实际的值。
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)