工作职责:
1、负责在服务器端和移动端,针对不同硬件架构(ARM CPU,GPU,DSP),设计和优化CV、NLP等算法的底层架构,以提高算法性能。
2、进行大模型的量化、剪枝、NAS等压缩算法的研究和实施。
3、探索和实施常见推理加速技术,包括网络架构、基本算子、模型推理框架等。
4、与算法研发团队合作,提升前沿算法的性能并进行产品化。
任职资格:
1、硕士及以上学历,拥有3年以上相关工作经验。
2、熟练使用C/C /Python等编程语言,具备良好的编程基础,熟悉多核多线程开发。
3、熟悉常见的深度学习训练和推理框架,了解主流框架的底层实现原理。
4、熟悉常用的深度学习模型推理加速方法,包括量化、压缩、剪枝等优化技术。
5、了解ONNX、OpenVino、TensorRT、NCNN等推理或加速框架者优先考虑。 6、具备自我驱动力、创新能力、团队协作能力、沟通能力和抗压能力。
加分项:
1、有CUDA编程经验,能够在CUDA层面进行优化设计与实现。
2、对TensorFlow、PyTorch等常用算子的底层实现有优化经验。
3、拥有大模型云端及边缘端推理加速优化项目经验。
工作职责:
1、负责在服务器端和移动端,针对不同硬件架构(ARM CPU,GPU,DSP),设计和优化CV、NLP等算法的底层架构,以提高算法性能。
2、进行大模型的量化、剪枝、NAS等压缩算法的研究和实施。
3、探索和实施常见推理加速技术,包括网络架构、基本算子、模型推理框架等。
4、与算法研发团队合作,提升前沿算法的性能并进行产品化。
任职资格:
1、硕士及以上学历,拥有3年以上相关工作经验。
2、熟练使用C/C /Python等编程语言,具备良好的编程基础,熟悉多核多线程开发。
3、熟悉常见的深度学习训练和推理框架,了解主流框架的底层实现原理。
4、熟悉常用的深度学习模型推理加速方法,包括量化、压缩、剪枝等优化技术。
5、了解ONNX、OpenVino、TensorRT、NCNN等推理或加速框架者优先考虑。 6、具备自我驱动力、创新能力、团队协作能力、沟通能力和抗压能力。
加分项:
1、有CUDA编程经验,能够在CUDA层面进行优化设计与实现。
2、对TensorFlow、PyTorch等常用算子的底层实现有优化经验。
3、拥有大模型云端及边缘端推理加速优化项目经验。
在求职过程中如果遇到扣押证件、收取押金、提供担保、强迫入股集资、解冻资金、诈骗传销、求职歧视、黑中介、人身攻击、恶意骚扰、恶意营销、虚假宣传或其他违法违规行为。请及时保留证据,立即向平台举报投诉,必要时可以报警、起诉,维护自己的合法权益。