全网整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:400-708-3566

并发读取文件并行处理:Go 语言 worker pool 实战教程

本文详解如何在 go 中安全实现“并发读取文件 + 并行处理行数据”,解决因通道关闭时机不当导致的死锁问题,通过分离读取、处理与聚合三阶段,并合理使用 goroutine 和 sync.waitgroup,构建健壮的无锁(mutex-free)流水线。

在 Go 中实现“并发读取文件并行处理”时,一个常见误区是将文件读取、任务分发和结果收集全部放在主 goroutine 中同步执行——这极易引发死锁。正如示例代码所示:主协程在 close(jobs) 后调用 wg.Wait(),但此时 worker 协程仍在阻塞等待 jobs 通道(虽已关闭,但需确保所有 worker 已退出),而主协程又未消费 results 通道,导致 results

核心原则:职责分离(Separation of Concerns)
应将流程拆分为三个独立并发阶段:

  • Producer(生产者):单独 goroutine 负责逐行读取文件 → 写入 jobs 通道 → 完成后关闭 jobs;
  • Workers(工作池):多个 goroutine 从 jobs 读取、执行正则匹配 → 将结果(如 1)写入 results;
  • Collector(收集器):单独 goroutine 监听 wg.Wait() 完成信号 → 关闭 results;主 goroutine 则安全地 range 消费 results。

以下是修正后的完整实现(关键改动已加注释):

func telephoneNumbersInFile(path string) int {
    file := strings.NewReader(path)
    telephone := regexp.MustCompile(`\(\d+\)\s\d+-\d+`)

    jobs := make(chan string, 100)   // 建议缓冲,避免 producer 因 consumer 慢而阻塞
    results := make(chan int, 100)

    wg := new(sync.WaitGroup)

    // 1️⃣ 启动 Worker 池(3 个)
    for w := 1; w <= 3; w++ {
        wg.Add(1)
        go matchTelephoneNumbers(jobs, results, wg, telephone)
    }

    // 2️⃣ 生产者:在新 goroutine 中读取文件并关闭 jobs
    go func() {
        scanner := bufio.NewScanner(file)
        for scanner.Scan() {
            jobs <- scanner.Text()
        }
        close(jobs) // ✅ 关键:必须在 goroutine 中关闭,避免阻塞主流程
    }()

    // 3️⃣ 收集器:等待所有 worker 结束后关闭 results
    go func() {
        wg.Wait()
        close(results) // ✅ 确保 results 可被 range 安全遍历
    }()

    // 4️⃣ 主 goroutine:安全聚合结果
    counts := 0
    for v := range results { // ✅ range 自动在 channel 关闭后退出
        counts += v
    }
    return counts
}

func matchTelephoneNumbers(jobs <-chan string, results chan<- int, wg *sync.WaitGroup, telephone *regexp.Regexp) {
    defer wg.Done()
    for line := range jobs { // ✅ range 自动在 jobs 关闭后退出
        if telephone.MatchString(line) {
            results <- 1
        }
    }
}

关键注意事项:

  • ? 通道缓冲很重要:jobs 和 results 均设为缓冲通道(如 make(chan T, 100)),可显著提升吞吐量,避免生产者/消费者因瞬时速度差而阻塞;
  • ? 永远不要在主 goroutine 中 close() 后立即 wg.Wait():这会形成竞态,必须由独立 goroutine 触发 close(results);
  • ? 无需 mutex:本方案完全基于通道通信(CSP 模型),天然线程安全,符合 Go “不要通过共享内存来通信”的哲学;
  • ? 扩展性提示:若需批量处理(如每次传入 []string),只需将 jobs 类型改为 chan []string,并在 Producer 中按需切片发送,Worker 内部遍历切片即可——逻辑不变。

此模式是 Go 中构建高并发 I/O 处理流水线的标准范式,适用于日志分析、ETL、配置解析等场景。掌握它,你便拥有了驾驭 Go 并发本质的一把关键钥匙。


# go  # ai  # 无锁  # String  # 线程  # 切片  # 并发  # etl  # 死锁  # 遍历  # 瞬时速度  # 收集器  # 放在  # 多个  # 只需  # 设为  # 适用于  # 并在 


相关文章: 如何处理“XML格式不正确”错误 常见XML well-formed问题解决方法  如何通过虚拟机搭建网站?详细步骤解析  陕西网站制作公司有哪些,陕西凌云电器有限公司官网?  制作网站的网址是什么,请问后缀为.com和.com.cn还有.cn的这三种网站是分别是什么类型的网站?  头像制作网站在线制作软件,dw网页背景图像怎么设置?  css网站制作参考文献有哪些,易聊怎么注册?  建站之星云端配置指南:模板选择与SEO优化一键生成  建站之星IIS配置教程:代码生成技巧与站点搭建指南  潍坊网站制作公司有哪些,潍坊哪家招聘网站好?  小型网站制作HTML,*游戏网站怎么搭建?  矢量图网站制作软件,用千图网的一张矢量图做公司app首页,该网站并未说明版权等问题,这样做算不算侵权?应该如何解决?  建站主机CVM配置优化、SEO策略与性能提升指南  网站制作企业,网站的banner和导航栏是指什么?  大连网站制作公司哪家好一点,大连买房网站哪个好?  建站之星免费模板:自助建站系统与智能响应式一键生成  内网网站制作软件,内网的网站如何发布到外网?  如何在阿里云香港服务器快速搭建网站?  建站之星五站合一营销型网站搭建攻略,流量入口全覆盖优化指南  如何生成腾讯云建站专用兑换码?  湖北网站制作公司有哪些,湖北清能集团官网?  如何挑选最适合建站的高性能VPS主机?  如何快速生成高效建站系统源代码?  如何在IIS中配置站点IP、端口及主机头?  南京做网站制作公司,南京哈发网络有限公司,公司怎么样,做网页美工DIV+CSS待遇怎么样?  Swift中循环语句中的转移语句 break 和 continue  国美网站制作流程,国美电器蒸汽鍋怎么用官方网站?  惠州网站建设制作推广,惠州市华视达文化传媒有限公司怎么样?  金*站制作公司有哪些,金华教育集团官网?  如何用wdcp快速搭建高效网站?  php8.4新语法match怎么用_php8.4match表达式替代switch【方法】  javascript基本数据类型及类型检测常用方法小结  c# 在ASP.NET Core中管理和取消后台任务  免费制作海报的网站,哪位做平面的朋友告诉我用什么软件做海报比较好?ps还是cd还是ai这几个软件我都会些我是做网页的?  深圳网站制作费用多少钱,读秀,深圳文献港这样的网站很多只提供网上试读,但有些人只要提供试读的文章就能全篇下载,这个是怎么弄的?  制作公司内部网站有哪些,内网如何建网站?  动图在线制作网站有哪些,滑动动图图集怎么做?  如何在Windows 2008云服务器安全搭建网站?  淘宝制作网站有哪些,淘宝网官网主页?  无锡制作网站公司有哪些,无锡优八网络科技有限公司介绍?  如何解决VPS建站LNMP环境配置常见问题?  c++怎么用jemalloc c++替换默认内存分配器【性能】  网站设计制作公司地址,网站建设比较好的公司都有哪些?  视频网站制作教程,怎么样制作优酷网的小视频?  建站之星北京办公室:智能建站系统与小程序生成方案解析  建站之星如何快速生成多端适配网站?  c# 在高并发下使用反射发射(Reflection.Emit)的性能  建站之星手机一键生成:多端自适应+小程序开发快速建站指南  武汉网站制作费用多少,在武汉武昌,建面100平方左右的房子,想装暖气片,费用大概是多少啊?  大学网站设计制作软件有哪些,如何将网站制作成自己app?  可靠的网站设计制作软件,做网站设计需要什么样的电脑配置? 

您的项目需求

*请认真填写需求信息,我们会在24小时内与您取得联系。