百度翻译接入指南

2021-04-28 16:54:11  晓掌柜  版权声明:本文为站长原创文章,转载请写明出处


一、背景


    最近在项目中设计到中英文翻译的功能需求,合情合理,所以肯定是要能支持到的!


二、技术选型


    2.1、实现设想

        自己写一个翻译软件肯定不不太可行的(我也整不出来啊),肯定是找寻一个现有的解决方案哈。

    2.2、目前市面上的翻译

        目前来说,比较为人所熟知的翻译主要有:百度翻译、谷歌翻译、有道翻译、金山翻译...并且他们也都有对应的api支持的。    

        ① 这里附上其相关的官方地址信息:https://fanyi.baidu.com/homehttps://translate.google.cn/https://ai.youdao.com/?keyfrom=old-openapi#/

        ② 其中百度翻译相关产品信息如下:


            


        ③ 有道翻译的产品相关信息如下:

            

            

       2.3、最终选型

            综合考虑,我这边选择百度翻译,只要看上标准版的免费哈!

            PS: 像阿里云翻译啊这些其实和有道翻译是差不多的,以资源包的形式来进行业务支持的。


三、接入流程

    

    3.1、注册百度翻译平台

        ① 在接入百度翻译时需要有账号支持,像普通的账号注册一样,我们按照其操作说明注册账号即可。

        ② 选择服务,我这边选择的是通用翻译的标准版

        ③ 配置api服务信息,主要是配置服务器IP(在配置之外的IP上时无法使用接入api的)

        ④ 整体操作后,控制台如下:


            


    3.2、接入须知

        这里借用官方的一些文字说明(更为详尽的信息请进入官方平台查阅:https://fanyi-api.baidu.com/doc/21

        通用翻译API通过HTTP接口对外提供多语种互译服务。您只需要通过调用通用翻译API,传入待翻译的内容,

        并指定要翻译的源语言(支持源语言语种自动检测)和目标语言种类,就可以得到相应的翻译结果。

        通用翻译API HTTP地址:

        http://api.fanyi.baidu.com/api/trans/vip/translate

        通用翻译API HTTPS地址:

        https://fanyi-api.baidu.com/api/trans/vip/translate   
        请求方式: 可使用GET或POST方式,如使用POST方式,Content-Type请指定为:application/x-www-form-urlencoded
        字符编码:统一采用UTF-8编码格式
        query长度:为保证翻译质量,请将单次请求长度控制在 6000 bytes以内。(汉字约为2000个)

        

            


        


    3.3、核心代码部分

        ① 翻译工具类


 public class TransUtil {

@Value("${baiduTranslate.appid}")
private String appid;

@Value("${baiduTranslate.securityKey}")
private String securityKey;

private static final String TRANS_API_HOST = "http://api.fanyi.baidu.com/api/trans/vip/translate";

public String getTransResult(String query, String from, String to) {
Map<String, String> params = buildParams(query, from, to);
return HttpClientUtil.doGet(TRANS_API_HOST, params);
}

private Map<String, String> buildParams(String query, String from, String to) {
Map<String, String> params = new HashMap<String, String>();
params.put("q", query);
params.put("from", from);
params.put("to", to);
params.put("appid", appid);

/* 随机数 */
String salt = String.valueOf(System.currentTimeMillis());
params.put("salt", salt);

/* 签名,加密前的原文 */
String src = appid + query + salt + securityKey;
params.put("sign", MD5.md5(src));
return params;
}

}


        ② MD5工具类


 public class MD5 {
/* 首先初始化一个字符数组,用来存放每个16进制字符 */
private static final char[] hexDigits = { '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'a', 'b', 'c', 'd',
'e', 'f' };

/**
* 获得一个字符串的MD5值
*
* @param input 输入的字符串
* @return 输入字符串的MD5值
*
*/
public static String md5(String input) {
if (input == null){
return null;
}

try {
/* 拿到一个MD5转换器(如果想要SHA1参数换成”SHA1”) */
MessageDigest messageDigest = MessageDigest.getInstance("MD5");
/* 输入的字符串转换成字节数组 */
byte[] inputByteArray = new byte[0];
try {
inputByteArray = input.getBytes("utf-8");
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
/* inputByteArray是输入字符串转换得到的字节数组 */
messageDigest.update(inputByteArray);
/* 转换并返回结果,也是字节数组,包含16个元素 */
byte[] resultByteArray = messageDigest.digest();
/* 字符数组转换成字符串返回 */
return byteArrayToHex(resultByteArray);
} catch (NoSuchAlgorithmException e) {
return null;
}
}

/**
* 获取文件的MD5值
*
* @param file
* @return
*/
public static String md5(File file) {
try {
if (!file.isFile()) {
System.err.println("文件" + file.getAbsolutePath() + "不存在或者不是文件");
return null;
}

FileInputStream in = new FileInputStream(file);

String result = md5(in);

in.close();

return result;

} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}

return null;
}

public static String md5(InputStream in) {

try {
MessageDigest messagedigest = MessageDigest.getInstance("MD5");

byte[] buffer = new byte[1024];
int read = 0;
while ((read = in.read(buffer)) != -1) {
messagedigest.update(buffer, 0, read);
}

in.close();

String result = byteArrayToHex(messagedigest.digest());

return result;
} catch (NoSuchAlgorithmException e) {
e.printStackTrace();
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}

return null;
}

private static String byteArrayToHex(byte[] byteArray) {
/* new一个字符数组,这个就是用来组成结果字符串的(解释一下:一个byte是八位二进制,也就是2位十六进制字符(2的8次方等于16的2次方))*/
char[] resultCharArray = new char[byteArray.length * 2];
/* 遍历字节数组,通过位运算(位运算效率高),转换成字符放到字符数组中去 */
int index = 0;
for (byte b : byteArray) {
resultCharArray[index++] = hexDigits[b >>> 4 & 0xf];
resultCharArray[index++] = hexDigits[b & 0xf];
}

/* 字符数组组合成字符串返回 */
return new String(resultCharArray);

}

}


    3.4、测试结果


        


四、后记


        其实搜索免费翻译平台api可以查出很多信息,也有品台支持到免费试用。我试了谷歌翻译和有道翻译的免费api,发现一个比较致命的问题,

    就是调用次数过多的时候会被限制(这是正常情况啦)。以谷歌翻译api为例,我在2s间隔的情况下调用六十多次就被限制了,有道翻译的api会好一些

    在2s间隔连续调用了170多次后还能使用。

        我也曾想过多去轮询有道和谷歌翻译但是总归还是有限流的风险的,这对于一个线上项目是很不友好的!那这里有朋友可能会说,你现在的通用翻译

    标准版的QPS也只是1,一样有可能无法满足业务情况!那么针对这种情况我们其实可以多注册几个账号,然后轮询使用多个api哈,当然如果这时也不能满足了

    那只能说你现在的业务量已经不能允许你白嫖了!老实注册一个高级版(每月还有200w的使用字符量的)。


    更多精彩,请持续关注:guangmuhua.com


最新评论: