文章 发布于 2017年07月05日  阅读 1204
当前大多数的互联网系统都使用了服务器集群技术,集群是将相同服务部署在多台服务器上构成一个集群整体对外提供服务,这些集群可以是 Web 应用服务器集群,也可以是数据库服务器集群,还可以是分布式缓存服务器集群等等。在实际应用中,在 Web 服务器集群之前总会有一台负载均衡服务器,负载均衡设备的任务就是作为 Web 服务器流量的入口,挑选最合适的一台 Web 服务器,将客户端的请求转发给它处理,实现客户...
作者 王新栋  发布于 2017年07月04日  阅读 3835
序京麦工作台是京东十万商家唯一的店铺运营管理平台。京麦服务技术架构从早期的单一nginx+tomcat部署,到现在的单一职责,独立部署,去中心化。期间团队开发了JSF/HTTP等多种协议下的网关、TCP消息推送、APNs推送、降级、限流等技术,如今京麦服务架构已然走在了微服务之路上,但微服务是软件架构的银弹吗,组件以服务的形式提供之后给我们的618备战提出了哪些挑战。本篇文章将深入解析京麦微服务技...
作者 张松然  发布于 2017年06月25日  阅读 1109
最近使用阿里云的 Ubuntu 16.04 ESC 服务器运行 Tomcat 时发现,Tomcat 启动的特别慢,通过查看日志,发现时间主要花在实例化 SecureRandom 对象上了。由该日志可以看出,实例化该对象使用了253秒,导致整个应用启动了275秒之久。注意这条日志:org.apache.catalina.util.SessionIdGeneratorBase.createSecure...
文章 发布于 2017年03月14日  阅读 457
一、服务器性能平常的工作中,在衡量服务器的性能时,经常会涉及到几个指标,load、cpu、mem、qps、rt,其中load、cpu、mem来衡量机器性能,qps、rt来衡量应用性能。一般情况下对于机器性能,load、cpu、mem是越低越好,如果有一个超过了既定指标都代表着可能出现了问题,就需要尽快解决(当然有可能是应用的问题也有可能是机器上其他程序引起的),反正就是如果不解决,时间长了肯定不好...
文章 发布于 2016年10月31日  阅读 1238
背景线上集群 load 会突然飙升,CPU 使用率 100%,无法响应正常请求,然后服务器宕机。那么引起 load 飙升的线程究竟在做什么?哪些线程霸占了CPU?可以通过 top 和 jstack 命令进行定位。定位步骤1. top 找出占用 CPU 高的进程 PID2. top -p PID -H 命令查出进程中占用CPU最高的线程3. 根据线程ID(需要十进制转成十六进制),从线程栈中找出步骤...
文章 发布于 2016年10月04日  阅读 1631
前言HashMap是我们平时开发过程中用的比较多的集合,但它是非线程安全的,在涉及到多线程并发的情况,进行put操作有可能会引起死循环,导致CPU利用率接近100%。final HashMap map = new HashMap(2);for (int i = 0; i { final K key; // 声明 key 为 final 型 ...
文章 发布于 2016年05月04日  阅读 1766
“If you cannot measure it, you cannot improve it” ———— William Thomson如果 Google 延迟 400ms,则搜索量下降 0.59%;Bing 延迟 2s,收入下降 4.3%;Yahoo 延迟 400ms,流量下降 5-9%;Mozilla 页面打开减少 2.2s,下载量提升 15.4%;Netflix 开启 Gzip,性能提升...
文章 发布于 2015年11月13日  阅读 895
当 Register 出现异常,Provider 重复注册地址,Register 就会不停地向 Consumer 推送大量的无效地址,造成 RPC 调用失败、超时等异常。系统崩溃就像滚雪球一样,迅速的崩溃。分析系统,线程数高,CPU、Load、内存良好,一定是出现线程死锁,分析 jstack。分析系统,线程数高,CPU 抖动、Load 飙升、频繁 Full GC,而 Net IO 降低,一定是有内存泄露,分析 jmap。
文章 发布于 2015年10月20日  阅读 1720
JavaMelody 可以实现对内存、CPU、线程、JDBC 连接数、HTTP 请求执行时间、SQL 执行时间(分析 Top SQL)、方法执行时间(分析系统方法性能瓶颈)等等的监控。配置方式1. pom.xml(加入依赖包) net.bull.javamelody javamelody-core 1.53.02. web.xml2.1. 配置过滤器,也可以配置不需要监控的 HT...
文章 发布于 2015年02月22日  阅读 1963
最近查看消息推送的监控信息,日推送量到百万,但是随之而来的是 TP99 搞到 5秒,详细对日志打了埋点,监控其瓶颈,最终定位是 Redis 的性能问题。但是令人疑惑的是,对比了其他应用系统 Redis 的性能,日吞吐量亿次的 TP99 才 5~10ms,故猜测一定是应用问题导致了 Redis 的性能下降!查看了应用服务器的网络 IO,发现网络吞吐量异常的汹涌!查看了 Redis 服务器的配置参数,...
共15条记录 共2页 上一页 首页 1