Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

mc-observability agent support metric list #19

Open
hyeon-inno opened this issue Aug 2, 2024 · 5 comments
Open

mc-observability agent support metric list #19

hyeon-inno opened this issue Aug 2, 2024 · 5 comments

Comments

@hyeon-inno
Copy link
Member

hyeon-inno commented Aug 2, 2024

support version measurement metric simple description detail ref. link
v0.2.0~ cpu usage_idle cpu idle percent link
v0.2.0~ mem total memory total bytes link
free memory free bytes
used memory used bytes
used_percent memory used percent
v0.2.0~ disk total disk total bytes link
free disk free bytes
used disk used bytes
used_percent disk used percent
v0.2.0~ diskio read_bytes diskio read bytes counter link
write_bytes diskio write bytes counter
v0.2.0~ processes link
v0.2.0~ swap link
v0.2.0~ tail link
v0.2.0~ system link

기본적인 자원의 사용량을 위한 metric에 대해 기재해두었습니다.
measurement에 따라 추가로 필요하신 항목이 있으시면 수집여부 확인 후 추가하도록 하겠습니다.

@seokho-son
Copy link
Member

@hyeon-inno (@powerkimhub )

특정 메트릭 추가에 대한 의견은 아니고, 관련하여 전반적인 질문이 있습니다.

  • Telegraf 가 제공하는 메트릭은 전체 수용도 가능할 것으로 보시나요? 아니면 이슈에 작성해주신 내용처럼 특정 메트릭을 선별해서 지정해야 하는 상황인지요?

  • Telegraf 가 제공하지 않는 메트릭도 지원도 고려하고 계신 상황인지요? (https://github.com/influxdata/telegraf/tree/release-1.26/plugins/inputs 중에 포함되지 않은 항목 및 메트릭 지원도 고려하고 계신지)

@seokho-son
Copy link
Member

@BSjaeyoung-kim 필요하신 메트릭 협의 부탁드립니다.

@hyeon-inno
Copy link
Member Author

@seokho-son
확인이 늦었습니다.

  1. telegraf가 제공하는 가능한 많은 메트릭을 수용하려고 하나 Observability의 안정성을 보장하는것을 우선으로 진행중에 있습니다.
    개발 완성도가 어느정도 궤도에 올라왔다고 판단되는 시점에 지원가능 메트릭을 확산해 나가려고 합니다.

  2. 현재 별도로 논의된적은 없던 사항이긴 합니다.

@BSjaeyoung-kim
Copy link
Member

@BSjaeyoung-kim 필요하신 메트릭 협의 부탁드립니다.

안녕하세요 현재 작성해주신 링크 확인하면서 메트릭 정보 확인중입니다.
내용 확인후 금주까지는 필요 메트릭에 대해 협의가 가능하도록 명시하도록 하겠습니다.

감사합니다.

@BSjaeyoung-kim
Copy link
Member

@hyeon-inno @seokho-son

안녕하세요
cost opti에서 필요한 메트릭 정보에 대해 공유드립니다.
현 메트릭은 AWS 기준입니다.
개발자 기준으로 자료의 산출이 가능한 서비스로 나누어 작성하였습니다.

cloudwatch
EC2에 연결되어있는 EBS정보
EC2에 연결되어있는 EIP 정보
EC2에 연결되어있는 ELB 정보

agent(EC2)
** 30일간에 대한 데이터가 필요합니다.
평균 CPU 사용률
최대 CPU 사용률
평균 memory 사용률
최대 memory사용률
평균 Network I/O 사용량, I/O 발생일수

agenct(RDS)
** 30일간에 대한 데이터가 필요합니다.
평균 Read/Write IOPS
DB Connection
평균 CPU사용률
최대 CPU사용률

위 내용은, 현재 저희가 최적화 로직 구현을 위하여 필요한 메트릭정보에 대해 기술한 내용입니다.
해당 메트릭에 대해서 수집이 어렵거나, 구현이 어려운 부분은 공유 부탁드리겠습니다(다른 방안이 있나 확인이 필요합니다)
예를 들어 cloudwatch의 경우 일전의 워크샵에서, cloudwatch에서 정보를 수집할 수 있다는 장표를 보고 작성한 내용이며, 이에 대해서 혹시 위와 같은 메트릭 수집이 가능한지에 대한 여부를 확인차 기술하였습니다.

논의사항 있다면 언제든 연락 바랍니다. 감사합니다.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants