前言

为了巩固所学的知识,作者尝试着开始发布一些学习笔记类的博客,方便日后回顾。当然,如果能帮到一些萌新进行新技术的学习那也是极好的。作者菜菜一枚,文章中如果有记录错误,欢迎读者朋友们批评指正。
(博客的参考源码可以在我主页的资源里找到,如果在学习的过程中有什么疑问欢迎大家在评论区向我提出)

发现宝藏

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。【宝藏入口】。

一、集合的创建

一、版面集合: catalogues
主键id(数据类型为整形)
关键字:keywords(数据类型为字符串)
isFuzzy: 0
搜索位置:searchArea(数据类型为字符串)
时间筛选:year(数据类型为时间类)
类型:form(数据类型为字符串)
领域:type(数据类型为字符串)
第几页:page(数据类型为整型)
来源:origin(数据类型为字符串)
source: 2
更新时间:updateTime(数据类型为时间类)

二、内容 cards
主键:id (数据类型为整形)
标题:title
来源: origin
原始网页html dom结构:htmlcontent
清洗后的html dom结构:content
第几页:page(数据类型为字符串)
搜索位置:searchArea(数据类型为字符串)
时间筛选:year(数据类型为时间类)
类型:form(数据类型为字符串)
领域:type(数据类型为字符串)
地址:url(数据类型为字符串)
内容图片存储的位置:illustrations(数据类型为数组)
更新时间:updateTime(数据类型为时间类)

为了生成 MongoDB 数据库,你首先需要安装 MongoDB 数据库服务器,并确保你的 Python 环境中安装了 PyMongo,这是 MongoDB 官方提供的 Python 驱动程序。
接下来,你可以按照以下步骤创建一个 Python 脚本来实现数据库的创建和数据插入:

1.安装 MongoDB:在你的机器上安装 MongoDB 数据库服务器。你可以从 MongoDB 官方网站下载安装程序并按照说明进行安装。

2.安装 PyMongo:在你的 Python 环境中安装 PyMongo 包。你可以通过 pip 进行安装:

pip install pymongo

3.编写 Python 脚本:编写一个 Python 脚本来连接 MongoDB,并创建两个集合(catalogues 和 cards),然后将数据插入这两个集合。

下面是一个示例 Python 脚本:

from datetime import datetime
from pymongo import MongoClient

# 连接 MongoDB 数据库服务器
client = MongoClient('mongodb://localhost:27017/')

# 创建或选择数据库
db = client['my_database']

# 创建或选择集合
catalogues_collection = db['catalogues']
cards_collection = db['cards']

# 插入示例数据到 catalogues 集合
catalogue_data = {
    'id': 1,
    'keywords': 'example keyword',
    'isFuzzy': '0',
    'searchArea': 'example search area',
    'year': datetime(2023, 1, 1),
    'form': 'example form',
    'type': 'example type',
    'page': 1,
    'origin': 'example origin',
    'source': 2,
    'updateTime': datetime.now()
}
catalogues_collection.insert_one(catalogue_data)

# 插入示例数据到 cards 集合
card_data = {
    'id': 1,
    'title': 'Example Title',
    'origin': 'example origin',
    'htmlcontent': '<html>Example HTML content</html>',
    'content': 'Example content',
    'page': 'example page',
    'searchArea': 'example search area',
    'year': datetime(2023, 1, 1),
    'form': 'example form',
    'type': 'example type',
    'url': 'example url',
    'illustrations': ['illustration1.jpg', 'illustration2.jpg'],
    'updateTime': datetime.now()
}
cards_collection.insert_one(card_data)

# 输出成功信息
print("Data inserted successfully into MongoDB.")

请注意,这只是一个示例脚本,用于演示如何连接 MongoDB 并将数据插入数据库中。在实际应用中,你可能需要根据你的需求来调整代码和数据结构。

二、集合的修改

要修改 MongoDB 中集合(Collection)的结构,你需要执行以下步骤:

1.连接到 MongoDB 数据库:首先,使用 Python 的 PyMongo 模块或 MongoDB 的客户端工具连接到你的 MongoDB 数据库。
2.备份数据:在修改集合结构之前,强烈建议对数据进行备份,以防止意外数据丢失。
3.修改集合结构:根据你的需求,修改集合结构可能涉及添加、删除或修改字段,或者重命名集合。下面是一些常见的操作:

-添加字段:可以通过更新现有文档或添加新文档的方式来添加字段。
-删除字段:使用 $unset 操作符从现有文档中删除字段。
-修改字段:可以使用 $set 操作符来修改现有文档中的字段值。
-重命名集合:使用 rename_collection() 方法重命名集合。
-验证修改:在修改集合结构后,验证修改是否正确。你可以查询集合以确保修改已成功应用,并且数据仍然可用和完整。
-更新应用程序代码:如果修改了集合结构,确保更新你的应用程序代码以反映这些更改。

以下是一个使用 PyMongo 修改 MongoDB 集合结构的示例代码:

from pymongo import MongoClient

# 连接到 MongoDB
client = MongoClient('mongodb://localhost:27017/')
db = client['my_database']

# 获取要修改的集合
collection = db['my_collection']

# 添加新字段到文档
collection.update_many({}, {"$set": {"new_field": "default_value"}})

# 删除字段
collection.update_many({}, {"$unset": {"old_field": 1}})

# 重命名集合
db.rename_collection('old_collection', 'new_collection')

# 验证修改
for doc in collection.find():
    print(doc)

# 关闭连接
client.close()

在这个示例中,我们假设已经连接到了名为 my_database 的数据库,并且要修改其中名为 my_collection 的集合。我们添加了一个名为 new_field 的新字段,删除了名为 old_field 的旧字段,并将集合重命名为 new_collection。最后,我们验证了修改是否成功,并关闭了数据库连接。

三、数据插入数据库

为了将数据插入 MongoDB 数据库,你需要使用 PyMongo 模块来与 MongoDB 进行交互。在你的 main 函数中,你可以添加连接到数据库的代码,并在适当的地方插入数据。以下是一个简单的例子:

from pymongo import MongoClient

def main():
    # 本地 MongoDB 连接信息
    mongo_host = "127.0.0.1"
    mongo_port = 27017
    database_name = "your_database"  # 替换为实际的数据库名称
    collection_name = "your_collection"  # 替换为实际的集合名称

    # 连接到 MongoDB
    client = MongoClient(mongo_host, mongo_port)
    db = client[database_name]
    collection = db[collection_name]

    # 现有数据或需要插入到 MongoDB 的数据
    data_to_insert = {
        'field1': 'value1',
        'field2': 'value2',
        'field3': 'value3',
        # 添加更多字段和值...
    }

    # 插入数据到 MongoDB 中的集合
    collection.insert_one(data_to_insert)

    # 关闭 MongoDB 连接
    client.close()

    # 程序主要逻辑...

if __name__ == "__main__":
    main()

在上述代码中,替换 mongo_host、database_name 和 collection_name 为你实际的 MongoDB 连接信息和集合名称。然后,创建一个字典 data_to_insert 包含你要插入的字段和对应的值,最后使用 insert_one 方法将数据插入到 MongoDB 集合中。
确保在插入数据之前已经连接到了 MongoDB,并在完成数据插入后关闭连接。此外,确保在 main 函数中添加适当的程序逻辑,以便你的脚本执行其他操作。

四、清空数据库集合数据

清除 MongoDB 集合中的所有数据可以使用 delete_many({}) 方法,传入一个空的查询条件,这将删除集合中的所有文档。在你的情况下,你想要清除 catalogues 和 cards 集合中的所有数据,可以按照以下方式进行:

from pymongo import MongoClient

def clear_collection_data():
    # 本地 MongoDB 连接信息
    mongo_host = "127.0.0.1"
    mongo_port = 27017
    database_name = "your_database"  # 替换为实际的数据库名称
    catalogues_collection_name = "catalogues"  # 替换为实际的集合名称
    cards_collection_name = "cards"  # 替换为实际的集合名称

    # 连接到 MongoDB
    client = MongoClient(mongo_host, mongo_port)
    db = client[database_name]

    # 清除 catalogues 集合中的所有数据
    catalogues_collection = db[catalogues_collection_name]
    catalogues_collection.delete_many({})

    # 清除 cards 集合中的所有数据
    cards_collection = db[cards_collection_name]
    cards_collection.delete_many({})

    # 关闭 MongoDB 连接
    client.close()

if __name__ == "__main__":
    clear_collection_data()

在这个例子中,我们定义了一个名为 clear_collection_data 的函数,它连接到 MongoDB,然后使用 delete_many({}) 方法清除了 catalogues 和 cards 集合中的所有数据。请确保替换连接信息、数据库名称以及集合名称为你实际的值。

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐