Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[WeeklyReports] 2024.08.12~2024.08.25 周报汇总 #353

Open
18 of 21 tasks
yinfan98 opened this issue Aug 26, 2024 · 17 comments
Open
18 of 21 tasks

[WeeklyReports] 2024.08.12~2024.08.25 周报汇总 #353

yinfan98 opened this issue Aug 26, 2024 · 17 comments

Comments

@yinfan98
Copy link
Collaborator

yinfan98 commented Aug 26, 2024

[WeeklyReports] 2024.08.12~2024.08.25 周报汇总

请各位学员在本 issue 下以 comment 的形式填写周报摘要,ddl 本周三晚,(sorry我发晚了)格式示例如下:

### 姓名

xxx

### 本周工作

1. xxx
2. xxx
 
### 下周工作

1. xxx
2. xxx

### 详细周报链接:

- https://github.com/PFCCLab/Camp/pull/xxx

护航计划

项目一:PIR 专项

项目四:组合机制建设

项目五:框架API易用性提升

项目八:PaddleDetection 套件能力建设

项目十:推理Predictor 及 IR Pass建设

项目十一:模型迁移工具建设

开源之夏

项目一:飞桨PaddlePaddle-PIR适配2ONNX推理转换

项目二:飞桨PaddlePaddle-动转静支持子图高阶微分

项目三:飞桨PaddlePaddle-PIR适配VisualDL模型可视化

GLCC

项目一:为Paddle推理新增Pass管理功能

项目二:为开源大语言模型推理增加优化Pass

项目三:飞桨Save/Load体系功能升级适配PIR

项目五:飞桨稀疏算子API升级适配PIR

项目六:动静统一自动并行支持 MoE 专家并行策略

@epiphanyer
Copy link
Contributor

姓名

曾志鹏

本周工作

  1. 对于仅在动态图下有定义的api,需要对python API进行适配升级,并补全静态图下的单测。主要包括paddle/sparse/binary.py中的二元算子。

下周工作

  1. 查漏补缺,对一些没有编写PIR分支的算子API继续编写PIR分支代码,并且为没有编写静态图单测的测试代码编写PIR静态图单测。

详细周报链接:

@zeroRains
Copy link
Contributor

姓名

卢林军

实习项目

组合机制建设和机制推全

本周工作

  1. 为expand_grad op 添加动态shape支持

相关 PR:

  1. 为stack_grad op 添加动态shape支持

相关 PR:

  1. 为pad_grad 添加动态shape支持

相关 PR:

  1. 为scale_grad, square_grad, transpose_grad, swiglu_grad添加动态shape单测,并按照字母序重新整理单测

相关 PR:

下周工作

  1. batch_norm,prod,dropout反向适配动态shape

详细周报链接:

@Xuxuanang
Copy link
Contributor

姓名

许轩昂

本周工作

  1. 完成对torch.cuda.amp.autocast,torch.diff,torch.distributed.rpc.shutdown等约80个单测的case增强,并修改其中部分算子的json配置文件,修改SoftMaxMatcher,提交了4次PR。已有两次PR成功合入主分支。

相关PR:

  1. 修改torch.hsplit,torch.Tensor.hsplit等部分存在重载问题的api的映射文档,使其与实际代码对齐。

相关PR:

下周工作

  1. 继续完成剩余单测的case增强,开发缺失Matcher
  2. 对齐改动的api映射文档

详细周报链接:

@Hanyonggong
Copy link
Contributor

姓名

韩用功

实习项目

推理Predictor 及 IR Pass建设

本周工作

1、fused_get_rope kernel算子支持rope_scaling,修复llama3.1精度问题

2、参考trtllm/vllm整理paddlenlp推理文档

详细周报链接

@Layssy
Copy link
Contributor

Layssy commented Aug 28, 2024

姓名

李伟

实习项目

推理Predictor 及 IR Pass建设

本周工作

算子的 Marker 的开发 和单测的实现

  1. 提交了elementwise_max、 elementwise_min 、elementwise_pow 、elementwise_floordiv 、elementwise_sub 、elementwise_div 、elementwise_mod、shape、greate_equal 的Marker到develop分支上

  2. 根据补充统计的文档开发marker和单测

    1. 已完成了pd_op.hardsigmoid、pd_op.hardswish、Pd_op.sigmoid、pd_op.cast、pd_op.max、pd_op.topk等
  3. 阅读了converter转换相关的代码

模型文档整理

  1. 完成 check_inference.sh 模型中算子的统计的文档
  2. 完成 check_inference.sh 模型算子不被支持的文档
  3. 完成 check_inference.sh 模型算子被支持的文档

下周工作

  1. 继续完成统计文档中未被支持算子的marker开发
  2. 完成converter的 开发

详细周报链接

#361

@Layssy

This comment was marked as duplicate.

@gouzil
Copy link
Contributor

gouzil commented Aug 28, 2024

姓名

gouzil

本周工作

  1. 修复 SOT 没能捕获 breakgraph 导致直接 raise 到最外层了, 收紧正确性. PR: #67591
  2. 收尾 [CodeStyle][Ruff] Ruff 新 rule 引入计划(第二期)[Typing][PEP585 Upgrade] PEP 585 标准集合泛型支持升级——Python 3.8 退场前瞻特别任务 两个任务

下周工作

  1. 在收紧正确性的前提下看能否支持非打断
  2. 分析和修复 https://www.paddlepaddle.org.cn/documentation/docs/zh/guides/paddle_v3_features/sot_cn.html#id2 示例代码报其他错误的问题
  3. 了解动转静体验优化现阶段已有的任务,并尝试对部分场景报错进行优化

详细周报链接:

@NKNaN
Copy link
Contributor

NKNaN commented Aug 28, 2024

姓名

李睿文

本周工作

  1. 继续进行针对 paddle.linalg.matrix_rank 的功能增强
  2. 修复 test_pad_op.py 存在的 bug
  3. 修复 paddle.linalg.lu 存在的 bug
  4. 优化 torch.gather/torch.Tensor.gather 的 API 转换规则
  5. 排查已修改的 58 个 API

下周工作

  1. 继续排查已修改的 58 个 API。
  2. 修改经排查发现的问题。
  3. paddle.load 对齐 torch.load 持更多路径对象。
  4. paddle.empty 等包含 dtype 参数的 API 添加⽀持 paddle.dtype 类型的输入。

详细周报链接:

@zrr1999
Copy link
Contributor

zrr1999 commented Aug 28, 2024

@lszxb
Copy link
Contributor

lszxb commented Aug 28, 2024

姓名

刘斯哲

本周工作

  1. 对目前demo中的静态图推理过程进行profile并进行优化
  1. 了解vAttention等显存管理的相关工作,并尝试进行实现自定义算子

下周工作

  1. 对之前提出的目前demo中的静态图推理过程的优化点进行最后的完善
  2. 阅读QServe系统的代码,了解其具体实现,看看是否还有可以改进的地方
  3. 依照vAttention框架的思路,实现具有类似机制的自定义算子,并编写优化pass

详细周报链接:

@aooxin
Copy link
Contributor

aooxin commented Aug 28, 2024

姓名

马奥欣

本周工作

  1. 修改之前记录到的问题
    • 修改tffnet中的问题
    • 修改pp-ocr-v2-rec中的问题
    • 修改faster_rcnn_r50_fpn_1x_coco中的问题
    • 修改mask_rcnn_r50_1x_coco中的问题
    • 修改rec_abinet中的问题
    • 修改rec_mv3_tps_bilstm_ctc_v2_0中的问题

下周工作

  1. 定位新提出的几个 pass 中的问题
  2. 对周中拿到的测试报告中提到的问题进行定位

详细周报链接:

@MINGtoMING
Copy link
Contributor

姓名

林镇铭

本周工作

基于rtdetr的开放世界目标检测

  • 继续试训、调整模型结构、调整相关参数

下周工作

  • 继续完善ovrtdetr的相关工作

详细周报链接

@fxfxfxfxfxfxfxfx
Copy link
Contributor

姓名

冯潇

实习项目

动静统一自动并行支持MoE专家并行策略

本周工作

  1. 构建了一个等效qwen2moe SparseMoEBlock的模型
  2. 将该模型改成自动并行版本并且验证其与单节点结果的一致性

下周工作

  1. 将qwen2moe SparseMoEBlock改成自动并行版本
  2. 编写单元测试

详细周报链接

#354

@cse0001
Copy link
Contributor

cse0001 commented Sep 1, 2024

姓名

谢一帆

实习项目

开源之夏 飞桨 PaddlePaddle-PIR 适配 VisualDL 模型可视化

本周工作

  1. 完成 visualdl 可视化控制流算子的功能开发

  2. 初步实现 json 格式存储的 paddle 模型的计算图可视化

  3. 修复已知 Bug

下周工作

  1. 完善 visualdl 对控制流算子的可视化

  2. 设计从 json 格式模型中获取算子所属 layer 的方法

详细周报链接

@eggman-1024
Copy link
Contributor

姓名

张瑞涛

实习项目

飞桨Save/Load体系功能升级适配PIR

本周工作

  1. 增加PIR体系下Load代码

    • serializer.cc/h, layer.cc/h, function_utils.cc/h, function_schema.cc/h, pir_interpreter_engine.cc/h 等代码文件中修改、增添代码以适配PIR体系。

下周工作

  1. 继续进行PIR体系下模型反序列化开发

详细周报链接

#368

@yinfan98
Copy link
Collaborator Author

yinfan98 commented Sep 6, 2024

姓名

尹帆

本周工作

  1. 继续设计评审方案

下周工作

  1. 评审方案答辩

详细周报链接:

@AndPuQing
Copy link
Contributor

姓名

梁嘉铭

实习项目

PIR 专项

本周工作

本双周工作集中在对于 静手自动并行 单测的修复以及单测deprecated。

相关PR

下周工作

  1. 继续跟进PIR分布式单测修复工作

详细周报连接

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests