数据库第5章:数据库完整性
1 基本概念数据的完整性和安全性是两个不同概念。
数据的完整性:
防止数据库中存在不符合语义的数据,也就是防止数据库中存在不正确的数据
防范对象:不合语义的、不正确的数据
数据的安全性
保护数据库防止恶意的破坏和非法的存取
防范对象:非法用户和非法操作
为维护数据库的完整性,DBMS必须:
提供定义完整性约束条件的机制
提供完整性检查的方法
违约处理
实体完整性和参照完整性:
关系模型必须满足的完整性约束条件
称为关系的两个不变性,应该由关系系统自动支持
用户定义的完整性:
应用领域需要遵循的约束条件,体现了具体领域中的语义约束
实体完整性规则的说明:
实体完整性规则是针对基本关系而言的。一个基本表通常对应现实世界的一个实体集。
现实世界中的实体是可区分的,即它们具有某种唯一性标识。
关系模型中以候选码作为唯一性标识。
候选码中的属性即主属性不能取空值。
主属性取空值,就说明存在某个不可标识的实体,即存在不可区分的实体,这与第2点相矛盾,因此这个规则称为实体完整性。
2 实体完整性2.1 候选码、主码、主属性
关系中的某一属性组 ...
书生·浦语大模型实战1-2
实战:部署实战营优秀作品 八戒-Chat-1.8B 模型八戒-Chat-1.8B、Chat-嬛嬛-1.8B、Mini-Horo-巧耳 均是在第一期实战营中运用 InternLM2-Chat-1.8B 模型进行微调训练的优秀成果。其中,八戒-Chat-1.8B 是利用《西游记》剧本中所有关于猪八戒的台词和语句以及 LLM API 生成的相关数据结果,进行全量微调得到的猪八戒聊天模型。作为 Roleplay-with-XiYou 子项目之一,八戒-Chat-1.8B 能够以较低的训练成本达到不错的角色模仿能力,同时低部署条件能够为后续工作降低算力门槛。
配置环境使用 git 命令来获得仓库内的 Demo 文件,其中的-b camp2是分支的意思。
1git clone https://gitee.com/InternLM/Tutorial -b camp2
克隆代码之后,运行以下代码下载模型:
1python /root/Tutorial/helloworld/bajie_download.py
下载结果如下:
八戒模型的介绍如下:
八戒-Chat八戒-Chat是利用《西游记》剧本 ...
书生·浦语大模型实战1-1
安装环境在刚打开开发机的过程中显示没有文件或路径,如下:
应该是误删了什么东西,因为指导书中写了一开始就配有base环境,但是我的没有,所以考虑重置一下环境吧。
以下是操作步骤:
慎重执行!!!!所有数据将会丢失,仅限 InternStudio 平台,自己的机器千万别这么操作*第一步本地终端 ssh 连上开发机(一定要 ssh 连接上操作,不能在 web 里面操作!!!)第二步执行 **rm -rf /root*,大概会等待10分钟第三步重启开发机,系统会重置 /root 路径下的配置文件第四步 *ln -s /share /root/share*
这里需要配置本地SSH远程连接,因此需要生成公钥和私钥,参考网上教程进行连接,连接成功如下:
接下来进行删除操作并重置环境。
可以看到,重新启动后没有那句报错了,成功解决,并且也有了初始环境base,看一下接下来安装conda环境有没有错误。
下载conda环境成功:
下载模型新建文件download_mini.py,内容如下:
12345678910111213import osfrom modelscope.hu ...
书生·浦语大模型笔记1
大模型概述大模型通常指的是具有庞大参数和复杂结构的机器学习模型。这些模型通过在大规模数据集上进行训练,能够学习到丰富的特征表示和复杂的映射关系。 大模型在众多领域都有广泛的应用,包括但不限于自然语言处理、计算机视觉、语音识别等。在自然语言处理领域,大模型可以用于文本分类、情感分析、机器翻译等任务;在计算机视觉领域,大模型可以实现高质量的图像识别和生成;在语音识别领域,大模型可以准确地将语音信号转换为文本。而在深度学习中,大模型往往表现为深度神经网络,如卷积神经网络(CNN)、循环神经网络(RNN)和变换器(Transformer)等。
大模型称为发展通用人工智能的重要途经
面向不同的需求,会有不同的模型。但是大模型可以使得一个模型解决多种任务,所以说通用大模型称为一个热点,是通往人工智能的一个关键途径。
回归语言建模的本质大模型本质上是在做语言建模,通过给定的文本,预测接下来的token。
大模型的挑战与未来展望尽管大模型在机器学习领域取得了显著成果,但仍面临一些挑战。首先,大模型的训练需要大量的计算资源和时间,这使得其在实际应用中受到一定限制。其次,大模型可能存在过拟合和泛化能力较 ...
信息安全实验1:数据的机密性
1 实验环境
操作系统版本:Windows 11 家庭中文版23H2
Microsoft Edge版本:122.0.2365.92(正式版本)(64位)
2 实验内容2.1 运行RSA加密程序,并进行改进RSA加密是一种非对称加密算法,它使用了一对密钥:公钥和私钥。RSA加密的安全性基于一个数学难题,即大素数分解。这个算法是由Ron Rivest、Adi Shamir和Leonard Adleman在1977年提出的,他们姓氏的首字母组成了这个算法的名字。
RSA加密的安全性基于大数分解问题的难度,即在已知n的情况下,将其分解为p和q的乘积。目前,除非使用非常大的素数并且密钥长度足够长,否则RSA加密是相对安全的。RSA算法在信息安全领域广泛应用于数据加密、数字签名和密钥协商等方面。
代码2.1是Python语言的RSA加密程序。
代码清单2.1 RSA加密程序Python实现
123456789101112131415161718192021222324252627282930313233import rsa import base64 # RSA加密 def rsa ...
一些杂谈
最近是五一假期,放假7天,并且一些任务也完成了,所以才有时间写下这个内容。
1 最近的一些感受1.1 关于截止时间的问题在生活中,有很多任务等着我们去完成,相应的就有很多重要的时间结点等着我们,有的时间结点可能距离我们较远,有的距离我们较近,如果提前规划好这些任务是很重要的。我认为做一件事,最晚可能需要提前一个月做,这个是在你想把它做好的情况下。换个角度,也就是说如果你想在某一件事情上达到比较好的水平,至少需要一个月的时间。
另外做一件事情的最好时间是十年前,其次就是现在,这一点我颇有感悟,因为我最近发生了很多这样的事情:我之前没有做,但是当我发现这件事会带来正向影响,自那之后我就坚持做,并且最近我得到了收益。这种事情举例如下:
学习强国:上学期有一个学习强国积分竞赛,但是由于我没怎么做,所以没有被选上,自那之后,每天都刷学习强国,现在我的总积分达到了22485,今年的学习己分达到了4910,并且在我们支部中是第一,第二分数为4811。虽然只相差100分,但是至少这100分我是花了时间的。
发展对象评选:也是上个学期,我积极分子已经满了一年,可以评选发展对象,但是由于要求班级思评必须 ...
记录我的第一篇论文
1 心理历程1.1 写论文之前的懵懂-开始了解为什么我要写论文,现在想来最主要还是为了保研可以加分吧,记得第一次萌生要写论文的想法是我们实验室的一个本科学长(峰哥)给我讲了论文对于保研加分还是挺关键的,当时他对我说了各种名词:“SCI一区二区”、“中文核心”、“会议”等,第一次听到这些的时候脑子里就是一团浆糊,完全不知道这些代表着什么含义,也不知道这些论文发表的难度。记得那时候是大二上学期,由于当时正在进行我现在待的实验室的考核,所以没太关注。
转眼到了大二下学期,由于疫情原因,大二上学期的期末考试没有进行,安排到了大二下开学进行。当时的我已经通过了考核,正式进入了现在所在的实验室。在刚开始时,峰哥又给我普及了很多关于保研的知识,而且告诉我最终保研成绩是如何计算的,以及论文和比赛能够加多少分,现在想来真的感触很深。因为我当时没有什么确切的方向,我也没有说一定要保研,也不知道要不要考研,但是峰哥当时给我说的一句话我到现在还记得呢:“你一定要保研啊”,或许就是这样一句话,给我指明了一些方向。
哈哈哈哈,大二下也没有写论文,应该是在学习一些基础知识,而且大二上(11月)谈了女朋友,当时12月 ...