AWS Lambda¶

AWS Lambda的展示指标包括冷启动时间、执行时间、并发执行数和内存使用量，这些指标反映了Lambda函数的响应速度、可扩展性和资源利用情况。

配置¶

安装 Func¶

推荐开通观测云集成 - 扩展 - 托管版 Func: 一切前置条件都自动安装好, 请继续脚本安装

如果自行部署 Func 参考自行部署 Func

安装脚本¶

提示：请提前准备好符合要求的亚马逊云 AK（简单起见，可直接授予CloudWatch只读权限CloudWatchReadOnlyAccess）

托管版开通脚本¶

登陆观测云控制台
点击【集成】菜单，选择【云帐号管理】
点击【添加云帐号】，选择【AWS】，填写界面所需的信息，如之前已配置过云帐号信息，则忽略此步骤
点击【测试】，测试成功后点击【保存】，如果测试失败，请检查相关配置信息是否正确，并重新测试
点击【云帐号管理】列表上可以看到已添加的云账号，点击相应的云帐号，进入详情页
点击云帐号详情页的【集成】按钮，在未安装列表下，找到AWS Lambda，点击【安装】按钮，弹出安装界面安装即可。

手动开通脚本¶

登陆Func 控制台，点击【脚本市场】，进入观测云脚本市场，搜索:integration_aws_lambda
点击【安装】后，输入相应的参数：AWS AK ID 、AK Secret 及账户名。
点击【部署启动脚本】，系统会自动创建 Startup 脚本集，并自动配置相应的启动脚本。
开启后可以在「管理 / 自动触发配置」里看到对应的自动触发配置。点击【执行】，即可立即执行一次，无需等待定期时间。稍等片刻，可以查看执行任务记录以及对应日志。

验证¶

在「管理 / 自动触发配置」确认对应的任务是否已存在对应的自动触发配置，同时可以查看对应任务记录及日志检查是否有异常
在观测云，「基础设施 / 自定义」中查看是否存在资产信息
在观测云，「指标」查看是否有对应监控数据

指标¶

配置好亚马逊-云监控,默认的指标集如下.可以通过配置的方式采集更多的指标:

亚马逊云监控 Lambda 指标详情

调用指标¶

指标	描述
`Invocations`	函数代码的调用次数，包括成功调用和导致函数错误的调用。如果调用请求受到限制或导致调用错误，则不会记录调用。Invocations 的值等于计费的请求数。
`Errors`	导致出现函数错误的调用的次数。函数错误包括您的代码所引发的异常以及 Lambda 运行时所引发的异常。运行时返回因超时和配置错误等问题导致的错误。要计算错误率，请将 Errors 的值除以 Invocations 的值。请注意，错误指标上的时间戳反映的是调用函数的时间，而非错误发生的时间。
`DeadLetterErrors`	对于异步调用，Lambda 尝试将事件发送到死信队列（DLQ）但失败的次数。资源误配或大小限制可能会致发生死信错误。
`DestinationDeliveryFailures`	对于异步调用和支持的事件源映射，Lambda 尝试将事件发送到目标但失败的次数。对于事件源映射，Lambda 支持流源（DynamoDB 和 Kinesis）的目标。权限错误、资源误配或大小限制可能会导致发生传输错误。如果您配置的目标是不支持的目标类型，例如 Amazon SQS FIFO 队列或 Amazon SNS FIFO 主题，则可能会发生这种错误。
`Throttles`	受限制的调用请求数。当所有函数实例都在处理请求并且没有可用于纵向扩展的并发时，Lambda 将拒绝其他请求，并出现 TooManyRequestsException 错误。受限制的请求和其他调用错误不会计为 Invocations 或 Errors。
`ProvisionedConcurrencyInvocations`	使用预置并发调用函数代码的次数。
`ProvisionedConcurrencySpilloverInvocations`	当所有预置并发均处于使用状态时，使用标准并发调用函数代码的次数。
`RecursiveInvocationsDropped`	Lambda 因为检测到您的函数是无限递归循环的一部分而停止调用您函数的次数。Lambda 递归循环检测通过跟踪由支持的 AWS 开发工具包添加的元数据，来监控函数作为请求链的一部分被调用的次数。如果您的函数作为请求链的一部分被调用的次数超过 16 次，Lambda 会中断下一次调用。

性能指标¶

性能指标提供了有关单个函数调用的性能详细信息。例如，Duration 指标指示函数处理事件所花费的时间量（以毫秒为单位）。要了解函数处理事件的速度，请使用 Average 或 Max 统计数据查看这些指标。

指标	描述
`Duration`	函数代码处理事件所花费的时间量。调用的计费持续时间是已舍入到最近的毫秒的 Duration 值。
`PostRuntimeExtensionsDuration`	函数代码完成后，运行时为扩展运行代码所花费的累积时间。
`IteratorAge`	对于从流读取的事件源映射，为事件中最后一条记录的期限。该指标测量流接收记录的时间到事件源映射将事件发送到函数的时间之间的时间量。
`OffsetLag`	对于自行管理的 Apache Kafka 和 Amazon Managed Streaming for Apache Kafka（Amazon MSK）事件源，写入到主题的最后一条记录与函数的使用者组处理的最后一条记录之间的偏移量差值。尽管 Kafka 主题可以包含多个分区，但此指标仍可在主题级别衡量偏移延迟。

并发指标¶

Lambda 将并发指标报告为跨函数、版本、别名或 AWS 区域处理事件的实例数的总计数。要查看接近并发限制的程度，请使用 Max 统计数据查看这些指标。

指标	描述
`ConcurrentExecutions`	正在处理事件的函数实例的数目。如果此数目达到区域的并发执行配额或您在函数上配置的预留并发限制，则 Lambda 将会限制其他调用请求。
`ProvisionedConcurrentExecutions`	使用预置并发处理事件的函数实例的数目。对于具有预置并发性的别名或版本的每次调用，Lambda 都会发出当前计数。
`ProvisionedConcurrencyUtilization`	对于版本或别名，为将 ProvisionedConcurrentExecutions 值除以分配的预置并发总数。例如，.5 指明有 50% 的已分配预配置并发正在使用中。
`UnreservedConcurrentExecutions`	对于区域，由不具有预留并发的函数处理的事件数。

异步调用指标¶

异步调用指标提供有关来自事件源的异步调用和直接调用的详细信息。您可以设置阈值和警报以通知您某些变化。例如，当排队等待处理的事件数量意外增加时 (AsyncEventsReceived)。或者，当一个事件等待了很长时间才完成处理时 (AsyncEventAge)。

指标	描述
`AsyncEventsReceived`	Lambda 成功排队等待处理的事件数。此指标可让您深入了解 Lambda 函数接收的事件数量。监控此指标并设置阈值警报以检查是否存在问题。例如，检测发送到 Lambda 的不良事件数量，并快速诊断因触发器或函数配置不正确而导致的问题。AsyncEventsReceived 和 Invocations 之间的不匹配可能表明处理过程存在差异、事件被丢弃或潜在的队列积压。
`AsyncEventAge`	Lambda 成功将事件排队到调用该函数之间的时间。当由于调用失败或节流而重试事件时，此指标的值会增加。监控此指标，并在出现队列积聚时针对不同统计信息的阈值设置警报。要解决该指标增加的问题，请查看 Errors 指标以识别函数错误，并查看 Throttles 指标以确定并发问题。
`AsyncEventsDropped`	在未成功执行函数的情况下丢弃的事件数。如果您配置了死信队列（DLQ）或 OnFailure 目标，则事件会在丢弃之前发送到那里。事件因各种原因被丢弃。例如，事件可能超过最大事件期限或耗尽最大重试次数，或者预留并发可能设置为 0。要解决该指标被丢弃的问题，请查看 Errors 指标以识别函数错误，并查看 Throttles 指标以确定并发问题。

Lambda 抓取 S3 数据¶

通过 AWS 中的 Lambda 对 AWS 中的 S3 数据进行抓取并上报到观测云中

关于 ELB 日志开启方式参考 AWS ELB 日志采集

一、使用控制台创建 Lambda 函数¶

打开 Lamba 控制台的函数页面。
选择创建函数
选择从头开始创作
输入函数名称
设置 运行时 选项为 Python 3.10
在 Execution Role（执行角色）中，选择 Create a new role with basic Lambda permissions（创建具有基本 Lambda 权限的新角色，具体权限列表请见附录，如已存在可使用最小权限角色可直接使用）。Lambda 创建执行角色，该角色授予函数上载日志到 Amazon CloudWatchlogs 的权限。在您调用函数时，Lambda 函数担任执行角色，并使用该执行角色为 Amazon 软件开发工具包创建凭证和从事件源读取数据
点击创建函数
在 GitHub 中拉取同步代码至下方代码源中将 lambda-forward.py 内容复制到 lambda-function.py 中
在将 lambda-function.py 相同目录下新建 setting.py、datakit.py、dataway.py 文件，并将 GitHub 中相应文件代码复制进去
添加环境变量
1. DATAKIT_IP：datakit 部署的 ip 地址，上报数据源为 datakit，必选
2. DATAKIT_PORT：datakit 服务端口，上报数据源为 datakit，非必选，默认：9529
3. DATAWAY_URL: dataway URL (Eg: https://xx-openway.xxx.com) 上报数据源为 dataway
4. WORKSPACE_TOKEN：平台工作空间 Token，上报数据源为 dataway
注意：上报数据源 datakit 与 dataway 必选一个，选择 datakit 请配置DATAKIT_IP，选择 dataway 请配置DATAWAY_URL、WORKSPACE_TOKEN
如果 datakit 端口不是默认的 9529 可添加环境变量 DATAKIT_PORT 填写为正确的端口地址（此变量非必填）
点击 Deploy 发布

二、配置 Lambda 触发器¶

点击 添加触发器
设置选择一个源为S3
选择需要监听的bucket
选择要触发 Lambda 函数的事件 Event types
同意我承认不推荐对输入和输出使用相同的 S3 bucket，并且这种配置可能导致递归调用、增加 Lambda 使用和增加成本
点击添加

访问 ELB 产生日志¶

访问 ELB 上的应用，ELB 将生成的日志上传到 S3，通过 Lambda 函数进行抓取并上报到观测云中

对象¶

采集到的AWS Lambda 对象数据结构, 可以从「基础设施-自定义」里看到对象数据

{
  "measurement": "aws_lambda",
  "tags": {
    "account_name"      :"AWS_Lambda",
    "class"             :"aws_lambda",
    "cloud_provider"    :"aws",
    "FunctionName"      :"dataflux-alb",
    "name"              :"dataflux-alb",
    "PackageType"       :"Zip",
    "RegionId"          :"cn-northwest-1",
    "RevisionId"        :"5e52ff51-615a-4ecb-96b7-40083a7b4b62",
    "Role"              :"arn:aws-cn:iam::294654068288:role/service-role/s3--xxxx-role-3w34zo42",
    "Runtime"           :"python3.7",
    "Version"           :"$LATEST"
  },
  "fields": {
    "CreatedTime"         : "2022-03-09T06:13:31Z",
    "ListenerDescriptions": "{JSON 数据}",
    "AvailabilityZones"   : "{可用区 JSON 数据}",
    "message"             : "{实例 JSON 数据}"
  }
}

注意：tags、fields中的字段可能会随后续更新有所变动

提示 1：tags.account_name值为实例 ID，作为唯一识别