TMS320F280049C 学习笔记10 控制率加速器 Control Law Accelerator (CLA) 入门_280049cla-程序员宅基地

技术标签: TI DSP学习  CLA  280049C  控制率加速器  

简介

2型控制律加速器(CLA)是一个独立的、完全可编程的32位浮点数学处理器,为C28x系列带来并行控制能力。CLA的低中断延迟允许它 “just-in-time.” (及时)读取ADC采样,显著减少了ADC采样到输出的延迟,从而实现更快的系统响应和更快的MHz控制环路。通过使用CLA为时间关键型控制回路提供服务,主CPU可以自由地执行其他系统任务,如通信和诊断。

以上关于CLA的介绍翻译自[1]的第5章。
[2]是TI官方的学习视频,提供了例程可供下载,是不错的入门材料。
[3]是编译器手册,第10章对CLA的编译器进行了介绍。
[4]对CLA的数学库做了介绍。
[5]讨论了CLA浮点计算时的舍入误差。
C2000Ware_3_01_00_00提供了7类共22个例程,文件位置在C:\ti\c2000\C2000Ware_3_01_00_00\driverlib\f28004x\examples\cla 本文将针对其中一部分进行测试。

转载[6] 我的浮点心 - CLA简介(上)

在TI的产品线中,F2803x Piccolo系列处理器主打低成本高效控制的路线。在数据计算部分,虽然有IQMath这个伪浮点数计算库,但是在平均最高60MHz的处理速度下,仍然后很多工作无法胜任。为了提高性价比,TI在其中引入了一个新的概念:控制率加速器(Control Law Accelerator, 简称CLA),主要功能是:在原有的CPU构架外,新增一个支持浮点运算的并行处理核心,实现“双核”控制。

什么时候需要用CLA?

  1. 有大量的浮点数学运算,CPU在计算之余,还需要去响应各种外设的请求。
    由于CLA是与原有的CPU并行进行计算,因此在原有的CPU中只需要设置好交换的数据并使能对应的CLA任务,CPU就可以去运行其它的任务,CLA运行完毕后会自动将规定好的数据传回。就好象对自己的助手说:“嘿,张三,帮我把这个表格按照公司的格式生成统计结果”,张三做完后会把数据送回来,而这段时间里你可以继续做其它的事情。
  2. 采用IQMath库的时候,无法同时满足“精度”和“范围”的需求。
    在IQMath库中,CPU将浮点运算转换成定点运算,因此有时无法在精度和范围两方面灵活互补,而CLA采用了浮点数,系统会自动对计算的精度和范围进行调整,达到最优的效果。
  3. 程序需要对运行速度进行深度优化。
    CLA运行的程序只能使用对应的汇编语言进行编程,用户可以在程序执行的流水线等待阶段插入不影响结果的语句,充分利用强大的计算能力,榨干处理器的每一点计算能力。

什么时候不适合使用CLA?

  1. 有大量的判断、跳转语句(if…else… for… while…)需要运行。
    由于CLA采用8级流水线结构,数据的计算能力非常强大,但是在判断和跳转语句中会造成后续的流水线失败,因此,大量的判断和跳转操作最好放在CPU中进行。
  2. 需要访问复杂的外设。
    CLA虽然和CPU共用大多数资源,但是前者只能访问PWM和ADC的有限的寄存器,其它的寄存器访问需要间接的向CPU请求,由此也可以看出来,CLA的存在,主要是为了强化基于PWM控制的运算,而CPU可以更轻松的控制丰富的外设。

CLA的有什么不足?

  1. 与CPU共用内存资源
    CLA没有自己的内存资源,因此必须从CPU中划分出对应的内存区域供CLA的程序和数据使用。
  2. 没有除法器只有乘法器和加法器
    CLA只有乘法器和加法器,没有硬件除法器,因此除法运算需要的周期还是远大于乘法。

翻译[2]

[2]是TI官方提供的一个CLA入门教程,以一个运行在28379DLaunchPad的示例项目初步介绍了CLA的使用方法。
[2]中的一些PPT总结的很好,挑了一些重点进行翻译,该PPT的原文件可以从[2]中下载到。
翻译如有不妥还请各位大佬指正。

CLA受限的C语法编译器

在这里插入图片描述

  • 后缀为.cla的文件被用做识别那些需要被编译和在CLA上运行的代码。或者,当设置为–cla_default时.c文件也可以被编译。
  • 不支持c标准库。
  • 数据类型(注意与C28x数据类型的不同! -使用stdint类型)
    char, short & pointers - 16 bits
    int long float long double & double - 32 bits
  • 不支持定义和初始化全局变量。CLA从复位中恢复时没有资源和运行库用来初始化变量。
  • 没有栈。局部变量和编译临时变量需要被存放在存储区".scratchapad"。
  • 支持多级函数调用(过去只支持一级函数调用) 。不支持递归和函数指针。

存储器模型

在这里插入图片描述
这页主要讲了不同的数据被放在什么区域。

  • 未初始化的全局变量放置在".bss_cla";
  • 已经初始化的常量放置在".const_cla";
  • 局部变量和编译临时变量放置在".scratchpad",其大小由编译器决定。
  • CLA的代码放置在"Cla1Prog"。
  • CLA没有C系统堆,因此不支持malloc之类的操作。

注意上述区域都在RAM中,在运行时需要从flash中拷贝到ram中。如果没有为".scratchpad"分配足够的空间则会报错。

从C28x向CLA移植代码

在这里插入图片描述

step 1

切换至CLA_CODE编译配置。将CLA变量分配给它们各自的内存空间。根据内存分配的那页PPT,使用#pragma将内存分配给变量。

step 2

在运行时将CLA的代码和常量从FLASH复制到RAM。我们将链接器定义的变量用于“Cla1Prog”和“.const_cla”部分

  • 我们需要首先向这些变量添加一个外部存储限定符,以便编译器知道它们存在;
  • 然后在initCLA()中的memcpy()中使用这些变量,在代码正上方的注释中提供了memcpy()的语法。
    在这里插入图片描述

step 3

让CLA控制程序和数据空间。您可以通过MMEMCFG寄存器(TRM 9.4.3.2)执行此操作。必须启用位:

  • 给予CLA对程序空间的控制(RAMLS0/1);
  • 让CLA控制我们的示例中使用的一个数据RAM(RAMLS2-5)。

step 4

当一个任务被触发时,CLA通过将任务的MVECTx寄存器加载到CLA的程序计数器(MPC)来跳转到该任务。MVECTx在低64Kw内存中包含该任务的地址。使用任务标签(例如Cla1Task1)设置任务1和8 的MVECT寄存器地址。
在这里插入图片描述

step 5

通过配置CLA1TASKSRCSELx寄存器来决定触发每个任务的事件。对于每个任务,它都有一个4位字段,其有一个外围触发器列表可供选择(TRM 2.14.7.3),或查看“F2837xD_Cla_defines.h”中提供的宏。在该示例中:

  • 任务1必须由ADCINT1触发;
  • 任务8没有触发器,将在软件中强制执行一次。

step 5续

您必须设置MIER(使能寄存器)中的相应位来全局启用要激活的任务。有关该寄存器的说明,见TRM的5.7.2.15。
在这里插入图片描述

step 6

由于CLA在启动时没有任何内存,因此我们不能让启动代码的__cinit()初始化任何CLA全局变量,因此,我们分配一个任务来执行它

  • 在我们的例子中,task8将把延迟系数D[0]清零。我们想运行一次。我们没有给它分配触发源,可以使用软件强制触发。
  • 我们通过MCTL寄存器启用软件强制触发(见TRM 5.7.2.9)。然后我们将运行任务8一次。“F2837xD_Cla_defines.h”有一些有用的宏函数来强制执行每个任务。

step 7

我们希望task1触发一个end-of-task中断。

  • 我们将PIE 向量表配置为跳转到右边的ISR(见TRM,表1-118);
  • 我们为cla-end-of-task-1中断启用PIE组及其子组(见TRM,表1-119)。
    在这里插入图片描述

step 8

将滤波器代码从adcintIsr1()逐字复制到“freq_proc.cla”文件中的Cla1Task1()

step 9

为任务8编写for循环,将D[]的所有元素初始化为0.
在这里插入图片描述

step 10

endof-task1 ISR应该完成adcint1Isr()所做的其余工作,即它应该缓冲CLA中的滤波值,然后当计数达到1024时,它应该向后台循环发出信号,表明应该对数据运行FFT。

  • 复制在adcint1Isr()中执行缓冲的代码并将其放入cla1Isr1()
  • cla1Isr1()应清除ADC中断标志并确认PIE中的中断

参考文献

  1. TMS320F28004x Microcontrollers Technical Reference Manual
  2. Control Law Accelerator (CLA) Hands-On Workshop
  3. TMS320C28x Optimizing C/C++ Compiler v20.2.0.LTS
  4. C28x Control Law Accelerator Math Library (CLAmath)
  5. 资料分享 C2000浮点运算注意事项——CPU和CLA的差异及误差处理技巧
  6. 我的浮点心 - CLA简介(上)
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/whyorwhnt/article/details/105254015

智能推荐

生活垃圾数据集(YOLO版)_垃圾回收数据集-程序员宅基地

文章浏览阅读1.6k次,点赞5次,收藏20次。【有害垃圾】:电池(1 号、2 号、5 号)、过期药品或内包装等;【可回收垃圾】:易拉罐、小号矿泉水瓶;【厨余垃圾】:小土豆、切过的白萝卜、胡萝卜,尺寸为电池大小;【其他垃圾】:瓷片、鹅卵石(小土豆大小)、砖块等。文件结构|----classes.txt # 标签种类|----data-txt\ # 数据集文件集合|----images\ # 数据集图片|----labels\ # yolo标签。_垃圾回收数据集

天气系统3------微服务_cityid=101280803-程序员宅基地

文章浏览阅读272次。之前写到 通过封装的API 已经可以做到使用redis进行缓存天气信息但是这一操作每次都由客户使用时才进行更新 不友好 所以应该自己实现半小时的定时存入redis 使用quartz框架 首先添加依赖build.gradle中// Quartz compile('org.springframework.boot:spring-boot-starter-quartz'..._cityid=101280803

python wxpython 不同Frame 之间的参数传递_wxpython frame.bind-程序员宅基地

文章浏览阅读1.8k次,点赞2次,收藏8次。对于使用触发事件来反应的按钮传递参数如下:可以通过lambda对function的参数传递:t.Bind(wx.EVT_BUTTON, lambda x, textctrl=t: self.input_fun(event=x, textctrl=textctrl))前提需要self.input_fun(self,event,t):传入参数而同时两个Frame之间的参数传..._wxpython frame.bind

cocos小游戏开发总结-程序员宅基地

文章浏览阅读1.9k次。最近接到一个任务要开发消消乐小游戏,当然首先就想到乐cocosCreator来作为开发工具。开发本身倒没有多少难点。消消乐的开发官网发行的书上有专门讲到。下面主要总结一下开发中遇到的问题以及解决方法屏幕适配由于设计尺寸是750*1336,如果适应高度,则在iphonX下,内容会超出屏幕宽度。按宽适应,iphon4下内容会超出屏幕高度。所以就需要根据屏幕比例来动态设置适配策略。 onLoad..._750*1336

ssm435银行贷款管理系统+vue_vue3重构信贷管理系统-程序员宅基地

文章浏览阅读745次,点赞21次,收藏21次。web项目的框架,通常更简单的数据源。21世纪的今天,随着社会的不断发展与进步,人们对于信息科学化的认识,已由低层次向高层次发展,由原来的感性认识向理性认识提高,管理工作的重要性已逐渐被人们所认识,科学化的管理,使信息存储达到准确、快速、完善,并能提高工作管理效率,促进其发展。论文主要是对银行贷款管理系统进行了介绍,包括研究的现状,还有涉及的开发背景,然后还对系统的设计目标进行了论述,还有系统的需求,以及整个的设计方案,对系统的设计以及实现,也都论述的比较细致,最后对银行贷款管理系统进行了一些具体测试。_vue3重构信贷管理系统

乌龟棋 题解-程序员宅基地

文章浏览阅读774次。题目描述原题目戳这里小明过生日的时候,爸爸送给他一副乌龟棋当作礼物。乌龟棋的棋盘是一行 NNN 个格子,每个格子上一个分数(非负整数)。棋盘第 111 格是唯一的起点,第 NNN 格是终点,游戏要求玩家控制一个乌龟棋子从起点出发走到终点。乌龟棋中 MMM 张爬行卡片,分成 444 种不同的类型( MMM 张卡片中不一定包含所有 444 种类型的卡片,见样例),每种类型的卡片上分别标有 1,2,3,41, 2, 3, 41,2,3,4 四个数字之一,表示使用这种卡片后,乌龟棋子将向前爬行相应的格子数

随便推点

python内存泄露的原因_Python服务端内存泄露的处理过程-程序员宅基地

文章浏览阅读1.5k次。吐槽内存泄露 ? 内存暴涨 ? OOM ?首先提一下我自己曾经历过多次内存泄露,到底有几次? 我自己心里悲伤的回想了下,造成线上影响的内存泄露事件有将近5次了,没上线就查出内存暴涨次数可能更多。这次不是最惨,相信也不会是最后的内存的泄露。有人说,内存泄露对于程序员来说,是个好事,也是个坏事。 怎么说? 好事在于,技术又有所长进,经验有所心得…. 毕竟不是所有程序员都写过OOM的服务…. 坏事..._python内存泄露

Sensor (draft)_draft sensor-程序员宅基地

文章浏览阅读747次。1.sensor typeTYPE_ACCELEROMETER=1 TYPE_MAGNETIC_FIELD=2 (what's value mean at x and z axis)TYPE_ORIENTATION=3TYPE_GYROSCOPE=4 TYPE_LIGHT=5(in )TYPE_PRESSURE=6TYPE_TEMPERATURE=7TYPE_PRO_draft sensor

【刘庆源码共享】稀疏线性系统求解算法MGMRES(m) 之 矩阵类定义三(C++)_gmres不构造矩阵-程序员宅基地

文章浏览阅读581次。/* * Copyright (c) 2009 湖南师范大学数计院 一心飞翔项目组 * All Right Reserved * * 文件名:matrix.cpp 定义Point、Node、Matrix类的各个方法 * 摘 要:定义矩阵类,包括矩阵的相关信息和方法 * * 作 者:刘 庆 * 修改日期:2009年7月19日21:15:12 **/

三分钟带你看完HTML5增强的【iframe元素】_iframe allow-top-navigation-程序员宅基地

文章浏览阅读1.7w次,点赞6次,收藏20次。HTML不再推荐页面中使用框架集,因此HTML5删除了<frameset>、<frame>和<noframes>这三个元素。不过HTML5还保留了<iframe>元素,该元素可以在普通的HTML页面中使用,生成一个行内框架,可以直接放在HTML页面的任意位置。除了指定id、class和style之外,还可以指定如下属性:src 指定一个UR..._iframe allow-top-navigation

Java之 Spring Cloud 微服务的链路追踪 Sleuth 和 Zipkin(第三个阶段)【三】【SpringBoot项目实现商品服务器端是调用】-程序员宅基地

文章浏览阅读785次,点赞29次,收藏12次。Zipkin 是 Twitter 的一个开源项目,它基于 Google Dapper 实现,它致力于收集服务的定时数据,以解决微服务架构中的延迟问题,包括数据的收集、存储、查找和展现。我们可以使用它来收集各个服务器上请求链路的跟踪数据,并通过它提供的 REST API 接口来辅助我们查询跟踪数据以实现对分布式系统的监控程序,从而及时地发现系统中出现的延迟升高问题并找出系统性能瓶颈的根源。除了面向开发的 API 接口之外,它也提供了方便的 UI 组件来帮助我们直观的搜索跟踪信息和分析请求链路明细,

烁博科技|浅谈视频安全监控行业发展_2018年8月由于某知名视频监控厂商多款摄像机存在安全漏洞-程序员宅基地

文章浏览阅读358次。“随着天网工程的建设,中国已经建成世界上规模最大的视频监控网,摄像头总 数超过2000万个,成为世界上最安全的国家。视频图像及配套数据已经应用在反恐维稳、治安防控、侦查破案、交通行政管理、服务民生等各行业各领域。烁博科技视频安全核心能力:精准智能数据采集能力:在建设之初即以应用需求为导向,开展点位选择、设备选型等布建工作,实现前端采集设备的精细化部署。随需而动的AI数据挖掘能力:让AI所需要的算力、算法、数据、服务都在应用需求的牵引下实现合理的调度,实现解析能力的最大化。完善的数据治理能力:面_2018年8月由于某知名视频监控厂商多款摄像机存在安全漏洞