-
运维监控做到什么程度,就达到 BATJ 的水准了?
所属栏目:[创业] 日期:2021-06-01 热度:103
疑问:为什么需要对上报方案有要求呢? 解读:比如腾讯内部的自研日志监控系统CMS,对拥有多种采集方案Agent、SDK、Kafka、ES等,各种不同的采集方案应对不同的场景 Agent:类似filebeat,指定服务器的具体路径,对文件的inode节点进行侦听,发现新增立即[详细]
-
为你分析bind设置DNS服务器
所属栏目:[创业] 日期:2021-06-01 热度:172
在此处,你将在该行的正上方指定区域文件信息,如下所示: zone dns01.fedora.local IN { type master; fileforward.fedora.local; allow-update { none;}; }; zone 1.168.192.in-addr.arpa IN { type master; filereverse.fedora.local; allow-update { n[详细]
-
云“战疫”:8天扩容100万核,我们是这样跟踪的
所属栏目:[创业] 日期:2021-06-01 热度:91
常见的监控手段为阈值监控,对业务形态比较熟练的开发、运维人员在指标上设置一个恰当的阈值,一旦偏离阈值,系统即发送告警到开发人员。 然而阈值设置的合理性不易判断。在数千万、上亿用户的场景下,阈值少设或多设 0.01% 都代表数千、上万人的体验受损[详细]
-
遍布全球数十个国家,千亿级的监控体系是这样炼成的
所属栏目:[创业] 日期:2021-06-01 热度:164
首先是游戏架构的变迁,从最开始的单机架构,扩展到分布式架构。也就是说,玩家看到一个游戏服,在后面会有十几台机器,有的甚至多达百台机器,取决于玩法不同。 后来,很多游戏的开发接触到微服务的概念,开始逐渐的把游戏里面比如大厅、聊天服务从游戏的[详细]
-
书本上没有的:万台服务器下运维怎样做好监控?
所属栏目:[创业] 日期:2021-06-01 热度:196
异常检测在运维实践中有着举足轻重的地位,实时、准确的发现异常能够帮助我们及时采取行动,最大限度减少故障的损失。 在监控领域中,其实最重要的一点是要能够通过一些监控指标发现问题,当我们的系统越来越大越来越复杂的时候,想从繁杂的指标当中,几百[详细]
-
轻松解决百万并发的Nginx,你知道它是怎么处理这些网络事件的吗
所属栏目:[创业] 日期:2021-06-01 热度:191
接下来看上面这张图,比如主机 A 就是一台家里的笔记本电脑,那么主机 B 就是一台服务器,上面跑着 Nginx 服务。从主机 A 发送一个 HTTP 的 GET 请求到主机 B,这样的一个过程中主要经历了哪些事件?通过上图数据流部分可以看出: 应用层里发送了一个 GET[详细]
-
从技术运营中台建设到AIOps落地,看着一篇就够了
所属栏目:[创业] 日期:2021-06-01 热度:67
我们就对下一代运维是怎么理解呢?其实当 5G 来了之后,我们理解是有两个新的要求:第一,我们面临的一些场景会变得复杂化,对原有运维能力的要求也更高了。第二,5G 来了之后运维边界也是不断拓展的。 第一点怎么理解呢?大家可以思考一个问题,我们运营[详细]
-
分析 | Nginx为什么快到停不下来?
所属栏目:[创业] 日期:2021-06-01 热度:126
HTTP 连接建立和请求处理过程 Nginx 启动时,Master 进程,加载配置文件 Master 进程,初始化监听的 socket Master 进程,fork 出多个 Worker 进程 Worker 进程,竞争新的连接,获胜方通过三次握手,建立 Socket 连接,并处理请求 Nginx 高性能、高并发 Ngi[详细]
-
一行代码怎样规避藏Linux进程?
所属栏目:[创业] 日期:2021-05-31 热度:99
总有朋友问隐藏Linux进程的方法,我说你想隐藏到什么程度,是大隐于内核,还是小隐于用户。网上通篇论述的无外乎 hook 掉 procfs 或者类似的用户态方案,也都难免长篇大论,我说,这些场面都太大了,太复杂了。对于希望马上看到效果的而言,看到这么一堆复[详细]
-
关机时间太长的研究和解决的方法
所属栏目:[创业] 日期:2021-05-31 热度:179
我的操作系统是使用 systemd 的 Ubuntu。这里的命令和步骤适用于任何使用 systemd 的 Linux 发行版(大多数发行版都是这样)。 检查哪些进程会导致 Linux 的长时间关机 如果你想找出问题所在,你应该检查上次关机时发生了什么。使用这个命令来获得我知道你上[详细]
-
解析|Docker的优缺点
所属栏目:[创业] 日期:2021-05-31 热度:188
启动虚拟机需要先启动虚拟机的操作系统,再启动应用,这个过程非常慢; 而启动 Docker 相当于启动宿主操作系统上的一个进程。 占用资源 虚拟机是一个完整的操作系统,需要占用大量的磁盘、内存和 CPU 资源,一台机器只能开启几十个的虚拟机。 而 Docker 只[详细]
-
Nginx 在运维领域中的应用,建议收藏
所属栏目:[创业] 日期:2021-05-31 热度:131
Nginx 已诞生十余年,其作为一款开源的 Web 服务器软件,因其具有性能稳定、高并发、低内存耗用、高性能的处理能力等特点,被广泛应用到国内外各互联网厂商的实际生产架构中。其主要有如下场景应用: Web 服务应用,可实现静态资源、PHP、Python 等网站的[详细]
-
分析DevOps,数据科学家需要掌握这些
所属栏目:[创业] 日期:2021-05-31 热度:85
为什么数据科学家需要了解DevOps 那么,在众多的工程和软件技能中,数据科学家应该学习哪一种呢?我的钱花在DevOps上了。 DevOps是development和operations的合成词,于2009年在比利时的一次会议上正式诞生。这次会议的召开是为了应对科技公司在历史上经历[详细]
-
靠谱脚本:查阅高CPU/内存消耗进程
所属栏目:[创业] 日期:2021-05-31 热度:127
副标题#e# ps是进程状态processes status,它显示有关系统上活动/正在运行的进程的信息。 它提供了当前进程的快照以及详细信息,例如用户名、用户 ID、CPU 使用率、内存使用率、进程开始日期和时间等。 1)检查高 CPU 消耗进程在 Linux 上运行了多长时间的[详细]
-
教你利用DNS over TLS
所属栏目:[创业] 日期:2021-05-31 热度:175
类似于下面所示修改/etc/systemd/resolved.conf。确保启用 DNS over TLS 并配置要使用的 DNS 服务器的 IP 地址。 $ cat/etc/systemd/resolved.conf [Resolve] DNS=1.1.1.19.9.9.9 DNSOverTLS=yes DNSSEC=yes FallbackDNS=8.8.8.81.0.0.18.8.4.4 #Domains=~[详细]
-
成为 Kafka 高手的诀窍:生产者深度实践总结
所属栏目:[创业] 日期:2021-05-31 热度:69
Client 指的是将会写入消息的多个不同的客户端,这里的客户端是一个抽象化的概念,只要和 kafka server建立了连接,将会写入消息到 kafka 中,无论是否在同一个服务器或者一个进程中,我们都把它称为一个 client。 Broker 指的是加入到了集群里面的服务器[详细]
-
PB 级大规模 Elasticsearch 集群运维与调优落地
所属栏目:[创业] 日期:2021-05-31 热度:122
因为游戏业务本身的日志数据量非常大(写入峰值在 100w qps),在服务客户的几个月中,踩了不少坑,经过数次优化与调整,把客户的 ES 集群调整得比较稳定,避免了在业务高峰时客户集群的读写异常,并且降低了客户的资金成本和使用成本。 场景 1:与客户的初[详细]
-
解析VTY Shell配置路由器
所属栏目:[创业] 日期:2021-05-31 热度:73
副标题#e# 由于 RIP 协议使用 UDP 作为传输协议,并被分配了 520 端口,因此我们需要在firewalld配置中允许该端口。 firewall-cmd --add-port=520/udp permanent firewalld-cmd -reload 现在,我们可以使用以下命令启动 FRR 服务: systemctl start frr 使[详细]
-
怎样运用firewall-cmd管理网络服务
所属栏目:[创业] 日期:2021-05-31 热度:152
处理服务、端口和协议 现在,重点关注services、ports和protocols所在行。默认情况下,防火墙将阻止所有端口、服务和协议,而只允许列出的。 在这里,你可以看到允许的服务是非常基本的客户端服务。例如,访问网络上的共享文件夹(samba-client)、与 DNS[详细]
-
万万没想到!智能运维的正确方式:从临场救火到淡然饮茶
所属栏目:[创业] 日期:2021-05-31 热度:158
啥是智能运维?如此神奇? 谈及智能运维的概念,洋气一些可被称为AIOps,正好是人工智能技术与基础运维能力的完美集合,一句话概括,运用机器学习的方法来提升运维效率。 稍微回顾下运维发展我们就能发现,在历经千锤百炼达成的传统自动化运维体系中,重复[详细]
-
运维遇上中台,瞬间阵亡?我是这样理解的
所属栏目:[创业] 日期:2021-05-31 热度:171
从14年底开始,互联网运维理念兴起之后,传统行业也开始日益重视运维平台的建设。甚至按照运维平台的建设情况来划分运维成熟度水平,典型阶段划分如下: 手工运维 以人工作业为主要表现形式的运维,发布、故障处理、巡检等等 脚本化运维 用一些自动化脚本来[详细]
-
老派架构云化后的运维,维护的是什么?
所属栏目:[创业] 日期:2021-05-31 热度:144
一、现状和面临的挑战 传统的IT架构使用了这么多年,所有的监控设备以及网络架构都是基于此打造,那么在传统架构虚拟化、云化后的今天,如何针对虚拟化、云计算的环境如IAAS、PAAS进行运维? 传统监控系统主要是基于传统的环境构建。主要是针对基础的硬件设[详细]
-
互联网大厂的运维都是什么工作内容?30K的总监来告诉你
所属栏目:[创业] 日期:2021-05-31 热度:90
运维人员对公司互联网业务所依赖的基础设施、基础服务、线上业务进行稳定性加强,进行日常巡检发现服务可能存在的隐患,对整体架构进行优化以屏蔽常见的运行故障,多数据中接入提高业务的容灾能力。 通过监控、日志分析等技术手段,及时发现和响应服务故障[详细]
-
DevOps与NoOps现状说明
所属栏目:[创业] 日期:2021-05-31 热度:160
DevOps和 NoOps的差异 DevOps是开发和运维的融合,是开发和运维工程师共同协作,定义应用从设计到交付全生命周期过程的实践。 NoOp的意思是无须操作。它的理念是去掉所有的平台管理部分,从而降低开发人员与基础设施之间的摩擦。 为何需要DevOps? 随着技术[详细]
-
在Fedora命令行下运用防火墙
所属栏目:[创业] 日期:2021-05-31 热度:195
网络防火墙,顾名思义:为了阻止不需要的网络连接而设置的防护性屏障。在与外界建立连接或是提供网络服务时常常会用到。例如,在学校或是咖啡厅里使用笔记本电脑时,你一定不想某个陌生人窥探你的电脑。 每个 Fedora 系统都内置了一款防火墙。这是 Linux[详细]

浙公网安备 33038102330469号