Deepseek之火,可以燎原
导读: 本次公开课由浙江大学医学院朱朝阳主讲,从中华文化基因等多方面探讨了DeepSeek的发展与应用。朱朝阳指出,中华文化的开放、包容和共享特质在DeepSeek中有所体现,与西方“自渡”理念不同,其更具“利他”“普度众生”的大乘法思想 。在语言层面,英文存在巴别塔魔咒、存储低效和空间浪费问题,而中文高效且可传承,DeepSeek在训练语料上中文占比合理、质量高,数据处理技术先进,在与ChatGPT的对比中优势明显。在技术突围上,DeepSeek通过算力优化、算法革新和架构创新打破技术壁垒,如采用思维链提升逻辑性能,运用知识蒸馏和混合专家(MOE)架构,证明了小规模高质量数据的价值 。课程还探讨了DeepSeek面临的争议,知识蒸馏并非抄袭,而是创新技术;人工智能在资源利用上存在争议,但DeepSeek相对低能耗。接着,课程阐述了AI发展需兼顾道与术,注重伦理安全,解决算法偏见等问题。在私有化应用方法上,介绍了增强本地DeepSeek能力的方案,如微调、提示词工程和检索增强生成(RAG)。RAG部署过程包括下载安装Cherry Studio、基座模型和嵌入模型,配置OLLAMA接口,管理模型和知识库等,还提到Ollama存在安全风险及加固建议。此外,课程讲解了大模型微调的LoRA和Backbone两种技术,以及基于LLaMA - Factory的轻代码微调方法,包括安装部署、必备项安装、训练模版制作、修改模板参数、准备数据集和训练等步骤,以实现如AI智能助教等本地微调应用。最后,课程展望中国AI发展,期待用AI技术探索传统经典文化,走有中国特色的AI发展道路。
温馨提示:本平台所有资料存储于知识星球平台,已加入的朋友可点击上方链接直接下载,未加入的朋友请扫描右侧二维码加入后方可下载。

免责声明:
来源: 浙江大学,互联互通社区推荐阅读,版权归作者所有。文章内容仅代表作者独立观点,不代表互联互通社区立场,转载目的在于传递更多信息。如涉及作品版权问题,请联系我们删除或做相关处理!