产品上把大模型的缺点规避掉了

错误生成有错误了，参考的文档中设置答案。

准确性患者的问题，

上传题库—生成的内容是虚假的（向量数据库进行检索）——具体的prompt生

最小demo实现！

个人知识库——关键字——对比——

爱好语音输入？文盲，只会说不会写

文字

视频长、大、处理有瓶颈

chatGLM抽取关键词和词频

分析在线/离线视屏解析，文字转写，

在线直播

不断递归式的抽摘要。

十条结果，然后展示，

视屏——文字——关键词+词云图

多模态、想法很重要。

调研优秀项目和协调个人想法。

功能多，产品形态上。

大视频，文本解析的好的方案？

1.whisper

2.加速方案

七分钟用的2080ti显卡，30s解析。

会议视屏长，直播撰写，实时的转写——提升撰写的效果。

最小demo实现！！

核心思路：先堆免费有资源的能力、再做更多稳定性和UI的考虑

一定是一个输入输出的结果。

目前掌握：

task1：智能编程助手

问答最小demo

task3：AI科研助手

上传PDF——解析PDF——拼接摘要Prompt—到大模型—输出给用户：

根据提问——Embedding和Faiss检索chunks——用户请求拼接Prompt—到大模型—结构输出给用户

客户端接收到用户上传的PDF后，发送到服务端。服务端首先完成PDF内容解析，然后拼接摘要Prompt并输入源大模型，得到模型输出结果后，返回给客户端并展示给用户。
如果用户接下来进行提问，客户端将用户请求发送到服务端，服务端进行Embedding和Faiss检索，然后将检索到的chunks与用户请求拼接成Prompt并输入到源大模型，得到模型输出结果后，返回给客户端进行结构化，然后展示给用户。

关键词提取	从论文中提取关键概念和术语，帮助用户快速了解研究重点。	x月x日
论文对比	比较两篇或者多篇论文的内容，总结他们之间的异同点。	x月x日
相关工作推荐	根据用户的兴趣领域推荐相关的最新研究成果。	x月x日

扩展功能：

1.视屏录像摘要，词云图——实时视屏摘要助手

2.导入的文档作为题目，给出正确选项——刷题助手？

3.

想法：

Joe-2002/LinChance_GPT: 本项目致力于打造数智化平台级智能人机交互产品，结合智能知识库和知识检索的功能，满足高效运行和优质服务的需求。 (github.com)

算法含量也很高

使用lora微调

交互逻辑

语言模型——十万个为什么——（实体gai）段文本少儿科普内容——打印卡片——版权ying

剧情卡片，多张卡片交互，组合几何级数的。语言模型能为。

传统早教机不可能为每种卡片设置不同的台词——补全每种组合的信息，产生创意性的句子进行学习

实体玩具的识别，注册实体玩具的识别，任意。

版权方面，实体玩具，古生物不容易被拍摄到的。

键盘版的demo

旋转位移放缩，泛化能力

A-B的映射

传统计算机映射——学生掌握的很好。

更强的迁移学习的能力，以前是数据标注

计算机及图形学，NeRF神经辐射场

社会不是随机的，按劳分配

Anki卡片制作，艾宾浩斯遗忘曲线，单词

数据分布在二维三维的空间上，

正样本和负样本，线性，

数据是高维空间的数据流行

二维纸的数据，一条线，（判别模型）延展为到三维一个面。

延展的数据一般是错的真实的数据。

生成模型会对样本的分布有更好的认知。

生成模型：

1.采样功能：数据中抽样中抽样出很像的数据

2.判别一个：数据在不在一个分布里。

过往的，例子：

不是

cat cat cat

I play guitar.概率更高

主谓宾

cat eat me

cat teach me

错误的

考虑下一次的概率

统计概率

后面更聪明的模型

隐函数：记忆

lstm rnn

告诉我要开始一个句子

输出一个次

再放入记忆

根据上一次的记忆和字再生成…

最终eos终止符

一层rnn，lstm的模型

多层，正过来反过来，9层十几层的模型。

attention技术，考虑某个词的时候，不止来自前一个记忆，先做判断跟之前的词哪个更相关，

attention+lstm=transforomer

9-12层，

GTP创新、-归一化的层，基础的原理是这样，词是以序列化输入，

4000-8000浮点数

图片生成

英语学习，网站过往的图片和生成的词。

collab工具

想出来的话生成图。

中文模型，clip模型没到。

扩散模型：

随机采样向量和图片对应的，

深度学习后的去噪的能力很强的。

除以信噪比越来越低，反过来深度学习是可以学习的。

噪音还原为原图。

如果我数据是高维空间的高位流行。

通过随机过程拉出diwei流行，Gan对抗生成，

姚期智GAN。

Diffusion背后的CLIP，

Zero-Shot Learning

句子和图编码为特征——图和句子的点乘比较大的。

把类别编码为句子，看图片的句子和句子之间的相似。

是很可怕的。零样本点学习。

黄色香蕉——绿色香蕉，迁移很强的。

深度学习特征和直方图特征有什么不一样？

传统颜色相近的，深度学习是语义相近的。

以图搜图。

最近邻分类。

迁移到另一个领域是非常强的。

Clip模型成功将语言和图片进行关联。

GTP4迁移进去，特征空间人脸编码到表情空间，

表情空间解码为不同的人，实现人脸的驱动。

Clip用了

数据集

都能识别出来的。1h筛1000个出来，2-10w张图。

10-100h小时标注，训练工业级。

新时代的工业检测会有很大改变的。

科创评委角度，加入到新的。

cahtgtp和copliot实时演示。初步做实验飞擦汗有效的。

GTP3的时候，openai和github合作，

重构一个东西，

新版信息技术提纲，写了爬虫。

python的爬虫，climper。

摄像机转换，

noit普及组的考试的。

偏上，偏下，偏左，偏右。

长的文本效果不是很好。

单元测试代码，

pygame

pymank

物理

不到2h实现，沟通成本过高，今天这个角度。

新的工具产生，新的工作流也会实现。

王天一，积分第一的选手。

每周一两次课，每周一两小时。

Openai,第五代编程语言

自然语言去操控编程。

前沿科技，辅助代码

需要能说清楚程序需求和输入输出，程序需求。

关注代码细节。买了接口，整体实现一个应用，分解，分布，核心算法部分研究的，向评委展示。

容易关注代码的细节，人均的实现能力

正面：10个人干更多的事情。

负面：外包，接受外包会有更大的需求。

monk物理的模拟。

标完数据，传统数据流。

colab

普通用户，